The search engine provides access to two versions of the IMPACT Polish GT corpus: so called one-dimensional and two-dimensional. This version is one-dimensional, i.e. the hyphenated words has been automatically reconstructed.

The corpus uses data made available by PSNC Digital Libraries Team, namely a set of full text versions of selected Polish historical documents from four digital libraries in Poland. The texts has been prepared in the framework of the IMPACT project and used as so called Ground-Truth for evaluation and training of OCR programs.

The corpus has been creating by Krzysztof Szafran using various free tools.

Some additional informations about the corpus are available in Janusz S. Bień's notes Changes to the IMPACT project Polish Ground-Truth texts and Delivering the IMPACT project Polish Ground-Truth texts with Poliqarp for DjVu.

The corpus consists of ca. 1.5 million segments. This version of the corpus is available since April 20, 2012.

The base fields of the tokens contain so called facsimile transcription, while the orth fields contain simplified so called textel transcription.

The metadata include the links to the digital library and the title field, which can be just displayed or used to limit the query with the meta clause.

The title field takes the following values:

Nowe Ateny albo Akademia wszelkiey scyencyi pełna, na różne tytuły iak na classes podzielona, mądrym dla memoryału, idiotom dla nauki, politykom dla praktyki, melancholikom dla rozrywki erygowana ... / przez Xiędza Benedykta Chmielowskiego ... . Część 1.
Nowe Ateny, albo Akademia wszelkiey scyencyi pełna, na różne tytuły iak na classes podzielona, mądrym dla memoryału, idiotom dla nauki, politykom dla praktyki, melancholikom dla rozrywki erygowana ... / przez Xiędza Benedykta Chmielowskiego ... . Część 2.
Nowe Ateny, albo Akademia wszelkiey scyencyi pełna, na różne tytuły iak na classes podzielona, mądrym dla memoryału, idiotom dla nauki, politykom dla praktyki, melancholikom dla rozrywki erygowana ... . Część 3 albo Supplement.
Nowe Ateny, albo Akademia wszelkiey scyencyi pełna, na różne tytuły iak na classes podzielona, mądrym dla memoryału, idiotom dla nauki, politykom dla praktyki, melancholikom dla rozrywki erygowana ... . Część 4, a drugi Supplement.
O cieplicach we Skle Ksiąg Troie. Przez Erazma Syxta Philozophiey y Medicyny Doktora Napisanych…
Oekonomika ziemianska generalna Punktámi Pártikulárnemi, Interrogatoryámi Gospodárskiemi, Praktyką Mieśięczną, Modelluszámi abo Tabułámi Arithmetycznemi obiaśniona. Pánom Dźiedzicznym, Arendarzom, Oekonomom, Attendętom, Urzędnikom, [...].
Zbiór rytmów duchownych Panegirycznych Moralnych i Swiatowych [...] Elżbiety z Kowalskich Druzbackiey [...] Zebrany y do druku podany przez J. Z. R. K. O. W. etc. [Załuskiego Józefa Andrzeja]
Discurs o cenie pieniedzy teraznieyszey y o niektorych skutkach iey…
Relacja koronacji cudownego obrazu Najświętszej Marii Panny na Górze Różańcowej [w Podkamieniu]
Żałosne opisanie upadku króla hiszpańskiego na morzu i na lądzie
Nowiny z Rakuz o monstrancji luterskiej
Powodzenia niebezpiecznego ale szczęśliwego wojska j. k. m. w Multanach opisanie
List o oblężeniu zamku Dyjamenckiego w Inflantach do Krzysztofa Moniwida Dorohostajskiego, dnia 22 października 1605 pisany
Nowiny z Inflant o porażce, która się stała nad Karolem, księciem Sudermańskim przez Jana Karola Chodkiewicza dnia 27 września 1605
Diariusz wiadomości od wyjazdu króla z Wilna do Smoleńska
Ceremonie i porządek w koronowaniu Marii de Medici, królowej francuskiej i nawarskiej 13 maja 1610
Szturm pocieszny smoleński, który był odprawiony szczęśliwie 13 czerwca 1611
Pasja żołnierzy obojga narodów w stolicy moskiewskiej krótko opisana
Nowiny z Torunia o zabronieniu przez heretyków nabożeństwa i procesji katolickich
Nowe nowiny z Czech, Tatar i Węgier, przy tym rewokacja księcia czeskiego i jak radę cesarską z zamku oknem wyrzucali i innego króla sobie obrali
Chorągiew Sarmacka w Wołoszech, to jest pospolite ruszenie i szczęśliwy powrót Polaków z Wołoch w roku 1621
Poseł z Wołoch z obozu polskiego. 1621
Relacja prawdziwa o wejściu wojska polskiego do Wołoch i o potrzebie jego z pogaństwem we wrześniu i październiku 1620
Adwersaria, albo terminata sprawy wojennej, która się toczyła w wołoskiej ziemi z tureckim cesarzem
Wieść z Moskwy prawdziwa krótkim rymem wyprowadzona
Nowiny z Moskwy albo wota z traktatów i konsulty panów radnych ziemi moskiewskiej, które carowi swemu podawali
Wyprawa i wyjazd sułtana Amurata, cesarza tureckiego, na wojnę do Korony Polskiej
Prawdziwa relacja i opisanie straszliwego trzęsienia ziemi 27 marca roku 1638 w Kalabrii
Relacja chwalebnej ekspedycji Jana Kazimierza, króla polskiego i szwedzkiego
Relacja spraw gdańskich na sejmie walnym warszawskim roku 1570
Sławna wiktoria nad Turkami od wojsk koronnych i Wielkiego Księstwa Litewskiego pod Chocimiem otrzymana
SŁAWNA VICTORIA, NAD TVRKAMI. OD WOYSK KORONNYCH: Y WIELKIEGO XIĘSTWA LITEWSKIEGO: Pod CHOCIMEM OtrZYMANA. W dźień SWIĘTEGO MARCINA w Roku 1673.

The users are invited to join the mailing lists: the announcement list and the discussion list.