Штучний інтелект від Facebook навчився розпізнавати текст на зображеннях і відео

Алгоритм Rosetta зможе розпізнавати меми та допоможе модераторам соцмережі зрозуміти їх зміст

СвітАндрій Стець, 13 вересня1590
Нейромережа використовує технологію оптичного розпізнавання тексту

Компанія Facebook оголосила про запуск нейромережі Rosetta, яка може розпізнавати текст на зображеннях і відео. Такий алгоритм повинен допомогти модераторам в боротьбі зі спамом, а також образливим контентом.

Про це повідомляється в офіційному блозі Facebook.

«Значна кількість фотографій в Facebook, і Instagram містять текст в різних формах. Він може бути накладений на зображення в мемі або зображений на фотографії вітрини, вуличного знака або меню ресторану. Ми побудували і розгорнули великомасштабну систему машинного навчання під назвою Rosetta. Вона витягує текст з більш ніж мільярда загальнодоступних зображень Facebook і Instagram на самих різних мовах, а потім щодня і в режимі реального часу вводить його в модель розпізнавання тексту», - розповідають розробники.

Нейромережа використовує технологію оптичного розпізнавання тексту, яка була створена Facebook в 2015 році. Вона визначає прямокутні області, які містять текст, а потім проводить розпізнавання і переведення картинки в текст. Крім фотографій і мемів, нейромережа також здатна покадрово сканувати відеоролики.

«Текст, витягнутий з зображень, використовується в різних моделях навчання на верхньому рівні, таких як ті, які покращують якість пошуку фотографій, автоматично ідентифікують контент, який порушує нашу політику ненависті на платформі різними мовами і підвищує точність класифікації фотографій в новинній стрічці», - відзначили в Facebook.

Само по собі розпізнавання тексту алгоритмами зі штучним інтелектом не є принципово новим кроком - робити це можуть багато існуючих програм, проте жодна з них не здатна впоратися з обсягами контенту, які пропонує Facebook.

За словами розробників, Rosetta, зможе розпізнавати меми та допоможе модераторам зрозуміти їх зміст. Автори технології вважають, що вона в перспективі допоможе ідентифікувати спам або образливий контент. Разом з цим вони визнають, що алгоритм потребує свого вдосконалення.

«Моделі розпізнавання тексту переважно зосереджені на наборах даних англійською мовою або з використанням латинки. Для підтримки глобальної платформи ми продовжуємо інвестувати в розширення моделі розпізнавання тексту для широкого числа мов, які використовуються в Facebook. З єдиної моделлю для великої кількості мов ми ризикуємо опинитися посередніми для кожної мови, що ускладнює завдання», - зізнаються розробники

Нагадаємо, раніше Facebook почав використовувати рейтингову систему проти фейкових новин.

Якщо Ви виявили помилку на цій сторінці, виділіть її та натисніть Ctrl+Enter
Пропозиції партнерів
Загрузка...
Останні новини
Залиште відгук