Common Crawl German – IISYS OpenData

The Common Crawl corpus contains petabytes of data collected over 12 years of web crawling.

Here, we host the German colossal, cleaned Common Crawl corpus.
This is a German text corpus which is based on Common Crawl. It has been cleaned up and preprocessed and can be used for various tasks in the NLP field. For example, for the self-supervised training of language models.

GC4 has been created by Philipp Reißel from ambeRoad with support from Philip May.
In a very simplified matter one can say:

HEAD: Consists of high quality text (e.g. newspaper, government websites)
MIDDLE: More colloquial language like forum entries, commentary sections
TAIL: The dark side of the Internet (not hosted here)

As it is classified through n-gram occurrences in comparison with the German wikipedia n-gram from our practical experience it worked quite well.
Use the following link to get more information about the GC4 Corpus: https://german-nlp-group.github.io/projects/gc4-corpus.html

Down below you can find the download links to get this dataset. For your convinience we providing a textfile containing all links.

Use the command $ tar xfvz *.tar.gz to extract the files.

Head Part

Download as plain Textfile: headpart.txt

https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0000_2015-48.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0000_2016-18.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0000_2016-44.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0000_2017-13.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0000_2017-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0000_2017-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0000_2017-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0000_2018-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0000_2018-17.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0000_2018-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0000_2018-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0000_2018-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0000_2019-18.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0000_2019-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0000_2019-47.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0000_2020-10.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0001_2016-44.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0001_2017-13.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0001_2017-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0001_2017-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0001_2017-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0001_2018-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0001_2018-17.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0001_2018-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0001_2018-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0001_2018-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0001_2019-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0001_2019-18.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0001_2019-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0001_2019-47.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0001_2020-10.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0002_2016-44.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0002_2017-13.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0002_2017-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0002_2017-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0002_2017-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0002_2018-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0002_2018-17.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0002_2018-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0002_2018-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0002_2018-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0002_2019-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0002_2019-18.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0002_2019-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0002_2019-47.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0002_2020-10.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0003_2016-44.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0003_2017-13.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0003_2017-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0003_2017-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0003_2017-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0003_2018-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0003_2018-17.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0003_2018-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0003_2018-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0003_2018-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0003_2019-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0003_2019-18.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0003_2019-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0003_2019-47.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0003_2020-10.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0004_2016-44.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0004_2017-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0004_2017-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0004_2017-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0004_2018-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0004_2018-17.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0004_2018-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0004_2018-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0004_2018-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0004_2019-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0004_2019-18.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0004_2019-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0004_2019-47.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0004_2020-10.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0005_2017-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0005_2018-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0005_2018-17.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0005_2018-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0005_2018-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0005_2018-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0005_2019-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0005_2019-18.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0005_2019-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0005_2019-47.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0005_2020-10.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0006_2018-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0006_2018-17.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0006_2018-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0006_2018-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0006_2018-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0006_2019-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0006_2019-18.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0006_2019-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0006_2019-47.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0006_2020-10.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0007_2018-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0007_2018-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0007_2019-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0007_2019-18.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0007_2019-47.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/head/de_head_0007_2020-10.tar.gz

Middle Part

Download as plain Textfile: middlepart.txt

https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0000_2015-48.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0000_2016-18.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0000_2016-44.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0000_2017-13.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0000_2017-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0000_2017-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0000_2017-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0000_2018-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0000_2018-17.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0000_2018-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0000_2018-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0000_2018-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0000_2019-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0000_2019-18.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0000_2019-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0000_2019-47.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0000_2020-10.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0001_2016-44.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0001_2017-13.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0001_2017-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0001_2017-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0001_2017-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0001_2018-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0001_2018-17.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0001_2018-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0001_2018-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0001_2018-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0001_2019-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0001_2019-18.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0001_2019-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0001_2019-47.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0001_2020-10.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0002_2016-44.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0002_2017-13.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0002_2017-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0002_2017-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0002_2017-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0002_2018-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0002_2018-17.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0002_2018-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0002_2018-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0002_2018-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0002_2019-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0002_2019-18.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0002_2019-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0002_2019-47.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0002_2020-10.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0003_2016-44.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0003_2017-13.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0003_2017-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0003_2017-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0003_2017-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0003_2018-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0003_2018-17.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0003_2018-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0003_2018-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0003_2018-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0003_2019-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0003_2019-18.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0003_2019-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0003_2019-47.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0003_2020-10.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0004_2016-44.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0004_2017-13.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0004_2017-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0004_2017-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0004_2017-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0004_2018-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0004_2018-17.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0004_2018-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0004_2018-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0004_2018-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0004_2019-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0004_2019-18.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0004_2019-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0004_2019-47.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0004_2020-10.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0005_2016-44.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0005_2017-13.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0005_2017-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0005_2017-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0005_2017-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0005_2018-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0005_2018-17.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0005_2018-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0005_2018-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0005_2018-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0005_2019-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0005_2019-18.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0005_2019-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0005_2019-47.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0005_2020-10.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0006_2016-44.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0006_2017-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0006_2017-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0006_2018-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0006_2018-17.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0006_2018-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0006_2018-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0006_2018-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0006_2019-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0006_2019-18.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0006_2019-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0006_2019-47.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0006_2020-10.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0007_2017-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0007_2018-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0007_2018-17.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0007_2018-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0007_2018-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0007_2018-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0007_2019-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0007_2019-18.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0007_2019-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0007_2019-47.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0007_2020-10.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0008_2018-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0008_2018-17.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0008_2018-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0008_2018-39.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0008_2018-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0008_2019-09.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0008_2019-18.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0008_2019-30.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0008_2019-47.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0008_2020-10.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0009_2018-51.tar.gz
https://opendata.iisys.de/opendata/Datasets/CommonCrawl/middle/de_middle_0009_2019-47.tar.gz