Tesseract OCR dla Polaka

Dla tych, którzy narzekają na słabe wsparcie dla języka polskiego w programach OCR o otwartym kodzie, interesujący może się okazać właśnie powstały projekt.

Tesseract-polish służy opracowaniu metody, która zapewni wysokiej jakości rozpoznawanie tekstów w języku polskim dla programu Tesseract OCR.

Aplikacja ta została uwolniona przez Google w 2006 roku i ma opinię jednego z najskuteczniejszych dostępnych silników OCR.

W projekcie przyda się pomoc osób chętnych drukować, skanować, a następnie żmudnie poprawiać znak po znaku pliki treningowe dla silnika Tesseract. Przydadzą się też pomysły na opracowanie jak najlepszych danych słownikowych.

Dla zainteresowanych przyłączeniem się do projektu powstał krótki dokument TrainingPL, wprowadzający w temat.

Warto przeczytać

Czym jest technologia OCR i dlaczego warto z niej korzystać?

Kto ma prawo do Open Source?

IX edycja Open Source Day już 26 kwietnia w Warszawie

Prawda czy fikcja? Popularny były haker twierdzi, że ma 7 miliardów dolarów w BTC

Certyfikat SSL, a hosting – dlaczego warto poszukać serwera z darmowymi certyfikatami?

75-latek dorabiał do emerytury na szyfrowaniu cudzych danych

Ujawniono najczęściej używane hasła w 2016 roku

Tanie laptopy poleasingowe – czym się charakteryzują i co je różni od nowego sprzętu z marketu?

Jaki tablet dla dziecka?

Pancerne laptopy – sprzęt, który sprawdza się w każdych warunkach

Zadbaj o swój kręgosłup i spraw sobie wygodne krzesło biurowe

Jak zrobić dobrze wyglądające wideo nawet jeśli nie jesteś profesjonalistą

Ta firma potrafi śledzić ruch przy pomocu dźwięku zamiast światła

Dzięki Google nasze smartfony będą na tyle inteligentne, że będą rozpoznawać ludzi i przedmioty w filmach wideo

Tłumacz Google wspomagany sztuczną inteligencją działa z trzema nowymi językami

Prawdziwie multimedialny Samsung Galaxy A5 (2017)

LTE w smartfonie - nie tylko do social media

Nadchodzące premiery smartfonów - Samsung Galaxy S9, LG G7 i inne

Kupujemy smartfon. O czym pamiętać?

Czym jest technologia OCR i dlaczego warto z niej korzystać?

Kto ma prawo do Open Source?

IX edycja Open Source Day już 26 kwietnia w Warszawie