У «Яндекса» появился поиск по архивам — рукописным историческим документам из архивов. На данный момент, поиск осуществляется по 2,5 миллионам документов архивов Москвы, Оренбургской и Новгородской областей, включая метрические книги, ревизские сказки и исповедные ведомости.
Конечно, было бы интересно почитать совсем иные архивы, но пока вот так. По большому счёту, на данном этапе, поиск этот больше интересен тем, кто любит искать родственников и строить свои генеалогические деревья.
Нас же больше заинтересовала сама технология. Ведь рукописные книги какого-нибудь 18-го века — это не сегодняшние записи: изменилось и написание, и язык был, мягко сказать, иным. Как говорил Шелдон Купер, вот вам fun fact: в большинстве случаев, когда нас просят ввести капчу на сайтах, нас заставляют обучать нейросеть. И вот когда вас просят ввести два слова, которые написаны какими-то корявыми буквами, это вас просят помочь обучить нейросетку расшифровывать старые тексты.
В «Яндексе» подошли к процессу иначе. Нейросеть обучали внутри компании на массиве рукописных строк из реальных текстов. Размечали и расшифровывали эти материалы эксперты, они же контролировали качество распознавания. Возможно, поэтому проект развивается не так быстро: слишком большое внимание уделяется качеству, а не количеству.
Поискать родственников и других людей в глубоком прошлом можно тут, а в комментариях — ждём вашей оценки: удалось ли кого-то найти. Мы вот, сходу, нашли 82 Козявкиных.
Автор: Контент Ревью.
Интересное...
0 коммент.:
Отправить комментарий
Ваш комментарий появится в блоге после проверки администратором