Поисковик Google научился различать слова на изображениях


Компания Google разработала систему оптического распознавания текста.

Поисковик Google научился различать слова на изображениях

Она позволяет поисковику различать текст на отсканированных изображениях. Об этом сообщается в официальном блоге Google.

В настоящее время Google способен распознать текст на изображениях, сохраненных в формате PDF. О планах Google по расширению возможностей системы не сообщается.

Поисковик уже начал индексировать PDF-файлы. Наибольшую сложность представляет поиск по старым отсканированным документам, где бумага, например, испачкана следами от чашки с кофе, либо имеются различные пометки, сделанные от руки.

Ранее Google запустил в экспериментальном режиме сервис Google Audio Indexing, распознающий звуковую дорожку в видеоклипах. Он конвертирует звук в текст и индексирует последний.

Кроме того, в начале сентября Google сообщил о планах по размещению в интернете отсканированных страниц старых газет и журналов. Они будут помещены в новостной архив поисковика и появятся в результатах поисковой выдачи, пишет Лента.Ру.


1324
Re-port.ru
Re-port.ru
+2450.9
ДОБАВИТЬ комментарий
Вы не авторизованы. При отправке сообщения, в качестве автора будет указан "Гость". Вход | Регистрация
Защита от спама * :