Назад

Библиотеки для выявления интернационализированных интернет-идентификаторов и их преобразования в гиперссылки

29.07.2024

Проект Поддерживаю.РФ и Координационный центр доменов .RU/.РФ как партнер Московского авиационного института (МАИ) предоставили практический кейс «Обработка текстовых данных на основе ИИ для выявления интернационализированных интернет-идентификаторов и их преобразования в гиперссылки». Кейс был использован в качестве выпускного задания для обучающихся «цифровой кафедры» МАИ по программам переподготовки «Прикладные задачи и фреймворки машинного обучения и анализа больших данных» и «Интеллектуальные технические системы». Программами предусмотрены практическая подготовка обучающихся и решение ими актуальных задач в области информационных технологий.

Библиотеки для выявления интернационализированных интернет-идентификаторов и их преобразования в гиперссылки


На программах переподготовки «цифровой кафедры» МАИ обучаются студенты инженерных и информационных направлений, участвовать в программах можно начиная со второго курса по основным образовательным программам бакалавриата, магистратуры и специалитета. Основной целью данных программ является развитие цифровых компетенций и углубленная подготовка студентов МАИ в области современных информационных технологий.

Для решения кейса студенты должны были разработать прикладные решения с использованием технологий искусственного интеллекта и учесть в них особенности работы с кириллическими доменными именами и адресами электронной почты. В результате командной работы студентов МАИ были успешно разработаны библиотеки для выявления интернационализированных интернет-идентификаторов и их преобразования в гиперссылки. В процессе работы под руководством экспертов Поддерживаю.РФ студенты разработали программные продукты, позволяющие, с использованием алгоритмов машинного обучения, определить в массиве текстовой информации доменные имена, URL, адреса электронной почты, никнеймы социальных сетей, телефоны, идентификаторы пользователей в мессенджерах и т.д. даже при наличии в них ошибок или опечаток, а потом преобразовывать их в гиперссылки. Всего в решении кейса участвовал 41 студент МАИ, все ребята успешно защитились.

«Это был очень интересный опыт и для нас, и для самих студентов. В итоге мы получили программные продукты, которые после небольших доработок могут быть использованы для решения актуальных практических проблем универсального принятия интернационализированных интернет-идентификаторов во всех информационных экосистемах. Во многом свою роль сыграл свежий взгляд на проблему, который есть у молодых людей, специализирующихся в области информационных технологий. Мы планируем и в дальнейшем участвовать в подобных программах и привлекать к решению практических задач студентов и молодых специалистов», – рассказала куратор проекта со стороны КЦ и руководитель проекта Поддерживаю.РФ Мария Колесникова.

Разработанные библиотеки для выявления интернационализированных интернет-идентификаторов и их преобразования в гиперссылки доступны по ссылкам:

https://github.com/DanFakey/HyperLink_identifier
https://github.com/Trezor52/Highlight-Hyperlinks.git
https://github.com/akihiko47/MAI-CK-Kiberzhabki

Команды студентов МАИ, работающие над кейсом, планируют продолжить доработку своих прикладных решений и заниматься их развитием.

Другие новости раздела

Ежегодный День универсального принятия прошел в Ереване
Ежегодный День универсального принятия прошел в Ереване
31.03.2026
Региональная конференция объединила представителей государства, международных организаций, технического сообщества и студентов технологическ...
Как создать сайт с доменом и почтой на кириллице
Как создать сайт с доменом и почтой на кириллице
12.03.2026
Рекомендации для администраторов и разработчиков сайтов
Российская платформа для управления ИТ-инфраструктурой BILLmanager подтвердила реализацию критериев универсального принятия домена .РФ
Российская платформа для управления ИТ-инфраструктурой BILLmanager подтвердила реализацию критериев универсального принятия домена .РФ
01.12.2025
Программный продукт получил свидетельство о реализации требований «серебряного уровня»
Пять критериев универсального принятия: «Отображение»
Пять критериев универсального принятия: «Отображение»
28.11.2025
Итоговая статья о реализации критериев универсального принятия в ПО
Крупные российские сайты поддерживают кириллические e-mail адреса пользователей
Крупные российские сайты поддерживают кириллические e-mail адреса пользователей
30.10.2025
Опубликованы результаты исследования поддержки кириллических адресов электронной почты популярными в России интернет-ресурсами
На РИФ 2025 состоялась церемония подписания Меморандума о развитии поддержки средств интернет-адресации на государственном языке Российской Федерации
На РИФ 2025 состоялась церемония подписания Меморандума о развитии поддержки средств интернет-адресации на государственном языке Российской Федерации
24.09.2025
К Меморандуму присоединились 4 организации
Состоялось совместное заседание Российской и Региональной рабочих групп по универсальному принятию
Состоялось совместное заседание Российской и Региональной рабочих групп по универсальному принятию
14.09.2025
Ежегодная очная встреча прошла на площадке TLDCON 2025
IDN Report 2025: как развиваются домены на родных языках
IDN Report 2025: как развиваются домены на родных языках
14.08.2025
Корпорация ICANN опубликовала отчет о развитии интернационализированных доменных имен за 2025 год