Команда Яндекса усовершенствовала функцию поиска по архивным документам, внедрив новую модель распознавания Alice AI VLM. Теперь сервис не только распознает текст из архивных файлов, но и структурирует информацию, выделяя роли участников событий и связи между людьми. Это позволяет пользователям сразу находить нужное имя и быстрее получать данные о своих предках.

Новая модель предоставляет возможность настраивать фильтры по событиям и ролям, таким как «родившийся», «отец», «мать» для документов о рождении или «жених», «невеста», «свидетель» для брачных свидетельств. Обновлённый сервис функционирует на базе мультимодальной модели Яндекса Alice AI VLM, которая обладает глубоким пониманием русского языка и изображений.

Разработчики отмечают, что благодаря этой модели удалось достичь высокой точности поиска, которая в среднем составляет 90,5%. Для записей о рождении точность достигает 92,7%, для свадеб — 89,7%, а для смертей — 87,2%. Это значительно улучшает качество поиска и удобство использования сервиса.

Напомним, что сервис Яндекса «Поиск по архивам» помогает быстро находить упоминания о людях, населённых пунктах и событиях в рукописных документах XVIII–XX веков. В базе сервиса содержится более 20 миллионов страниц исторических документов из архивов различных регионов России, а также информация из более чем 200 дореволюционных и советских газет и справочников.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *