Wykorzystywany przez wyszukiwarkę egzemplarz słownika znajduje się w e-bibliotece Uniwersytetu Warszawskiego, gdzie jest dostępny od lutego 2008 roku w formacie DjVu. Osiem tomów słownika liczy łącznie 7667 stron, w tym 7541 stron części hasłowej (dane z książki Magdaleny Majdak „Słownik warszawski. Koncepcja — Realizacja — Recepcja”, Warszawa 2008).
Optyczne rozpoznawanie znaków wykonali pracownicy biblioteki — Tomasz Trynkowski i Grzegorz Kłębek — za pomocą programu Abby FineReader w wersji 8.
Wyniki OCR skonwertował na format korpusu Jakub Wilk. Korpus ten liczy ok. 11 mln segmentów. Aktualnie dostępna jest wersja 2 korpusu z 6 stycznia 2010.