Wykorzystywane przez wyszukiwarkę 15 tomów Słownika Geograficznego Królestwa Polskiego i innych krajów słowiańskich (łacznie prawie 15 tysięcy stron, w tym 14758 stron z hasłami) znajduje się na witrynie Komputery i Polszczyzna na serwerze Wydziału Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego.
Jest to pierwsza internetowa edycja tego słownika, sporządzona w 2005 r. przez Janusza S. Bienia z inicjatywy Ewy Stachowskiej-Musiał, ówczesnej kierownik Oddziału Zabezpieczania i Konserwacji Zbiorów Biblioteki Uniwersyteckiej w Warszawie. Rok później Małopolska Biblioteka Cyfrowa opublikowała wersję cyfrową opartą na skanach przygotowanych w 2003 r. przez ZETO w Tarnowie i wcześniej udostępnianych tylko na płytach CD. Dwa lata później (7 maja 2007 r.) swoją edycję uzupełnioną o wyszukiwarkę udostępniło Interdyscyplinarne Centrum Modelowania Matematycznego i Komputerowego Uniwersytetu Warszawskiego w ramach uroczystej inauguracji Domeny Internetowych Repozytoriów Wiedzy (obecnie Otwarta Nauka).
Skanowanie słownika wykonała w 2003 r. Biblioteka Uniwersytecka w Warszawie z inicjatywy Interdyscyplinarnego Centrum Modelowania Matematycznego i Komputerowego, które częściowo finansowało tę pracę. OCR wykonał w 2010 r. Janusz S. Bień za pomocą programu FineReader 10 (język polski, pozostałe parametry domyślne) zapisując wyniki w formacie PDF, które następnie za pomocą programu pdf2djvu skonwertował na format DjVu (zastępując poprzednią wersję plików) i przekształcił wyniki OCR na format korpusu.
Korpus ten liczy ok. 19 mln segmentów. Aktualnie dostępna jest wersja 1 korpusu z 12 listopada 2010.
Wyszukiwanie może być ograniczone do konkretnych tomów za pomocą warunku meta, np. meta vol=i/X
lub meta vol=I/X
ogranicza wyszukiwanie do pierwszego tomu.
Za pomocą warunku within
wyszukiwanie może być ograniczone do sekcji, noszących umowne nazwy:
front
(tytularia itp.),
intro
(wstępy zawarte w I tomie),
list
(listy haseł na początku poszczególnych tomów),
body
(hasła),
errata
(erraty i uzupełnienia, ta sekcja zawiera się w body
),
back
(końcowe strony tomu),
inset
(wkładki z wykazem źródeł i skrótów).