Как стать автором
Обновить
71.86

Natural Language Processing *

Компьютерный анализ и синтез естественных языков

Сначала показывать
Порог рейтинга

MTS AI выпустила Cotype Pro 2 — второе поколение LLM для бизнеса

Время на прочтение1 мин
Количество просмотров507

MTS AI представила новую версию своей большой языковой модели Cotype для бизнеса — Cotype Pro 2. Новая модель на 40% быстрее предыдущей и на 50% точнее обрабатывает длинные тексты — до 128 тыс. токенов, что соответствует примерно 900 тыс. символов с пробелами. Она адаптирована под выполнение более чем 100 сценариев корпоративных пользователей в России и может быть развернута на собственной инфраструктуре компании без подключения к внешним серверам, что обеспечивает повышенную защиту данных. Модель вошла в пятерку лучших русскоязычных LLM в бенчмарке MERA от Альянса в сфере искусственного интеллекта. 

Читать далее

Новости

«Авито» планирует инвестировать в GenAI 12 млрд рублей и запустить новые образовательные программы для подготовки кадров

Время на прочтение2 мин
Количество просмотров1.5K

«Авито» планирует вложить в технологии искусственного интеллекта 12 млрд рублей и получить от этого к 2028 году 21 млрд рублей выручки. Компания также представила семейство собственных генеративных моделей и анонсировала запуск образовательных программ совместно с университетами для подготовки профильных специалистов.

По данным «Авито», уже в 2024 году внедрение GenAI-продуктов принесло компании 670 млн рублей выручки. 

Читать далее

Инженер купил домен «OGOpenAI» для китайской DeepSeek

Время на прочтение2 мин
Количество просмотров3K

Инженер-программист Ананай Арора приобрёл домен «OGOpenAI.com» и перенаправил его на DeepSeek — китайскую лабораторию искусственного интеллекта, которая выпускает мощные языковые модели с открытым исходным кодом, соревнуясь с OpenAI.

Читать далее

Дарио Амодеи, CEO Anthropic: «ИИ может превзойти человеческий разум к 2027 году»

Время на прочтение2 мин
Количество просмотров1.9K

Генеральный директор компании Anthropic Дарио Амодеи отметил, что его стартап в области ИИ спешит обеспечить необходимую вычислительную мощность, чтобы удовлетворить растущий спрос на генеративный чат-бот Claude.

Читать далее

Истории

Разработчики Qwen запустили собственный чат в виде веб-приложения

Время на прочтение1 мин
Количество просмотров12K

Разработчики семейства моделей Qwen объявили о запуске веб-приложения (чата): https://chat.qwenlm.ai/. Для регистрации нужен только email. На выбор доступны 8 моделей, две из которых с поддержкой распознавания изображений и одна (Turbo) — с входным контекстом размером 1 миллион токенов.

Читать далее

Тренды ИИ-2025

Время на прочтение8 мин
Количество просмотров8.4K

Всем привет! Я Федор Горбунов, руководитель направления машинного обучения в Doubletapp. Сегодня поговорим о том, какие значимые для искусственного интеллекта события произошли в 2024 году и попробуем спрогнозировать вектор развития отрасли в будущем.

Читать далее

Кинорежиссёр попытался заставить ChatGPT написать сценарий, но чат-бот постоянно срывал сроки и искал отговорки

Время на прочтение2 мин
Количество просмотров3.3K

Кинорежиссёр Ненад Чичин-Сайн («Навсегда», документальный фильм Kiss The Future) решил испробовать возможности искусственного интеллекта для создания сценария. Идея не увенчалась успехом: ChatGPT вёл себя неадекватно, постоянно нарушал сроки, находил оправдания и пытался манипулировать собеседником. 

Читать далее

Perplexity покупает стартап Carbon, который специализируется на технологии RAG

Время на прочтение2 мин
Количество просмотров2.5K

18 декабря Perplexity объявили о приобретении стартап-компании из Сиэтла Carbon, специализирующуюся на подключении систем искусственного интеллекта к внешним источникам данных. По словам генерального директора Аравинда Шриниваса, это позволит Perplexity уже в начале 2025 года осуществлять поиск по файлам и рабочим сообщениям пользователей в Notion, Google Docs, Slack и других корпоративных приложениях.

Carbon специализируется на технологиях retrieval augmented generation (RAG), позволяющих крупным языковым моделям обращаться к внешним базам данных до формирования окончательного ответа. Внедряя технологию и привлекая специалистов из компании Carbon, Perplexity готовится к запуску продуктов для корпоративного поиска. Эти инструменты объединят генеративный искусственный интеллект с корпоративными хранилищами данных, что позволит сотрудникам эффективно работать с большими объёмами неструктурированной информации, накопленной за долгое время.

Читать далее

Mozilla выпустила открытый набор голосовых данных Common Voice 20

Время на прочтение1 мин
Количество просмотров1.8K

Компания Mozilla представила новую версию датасета Common Voice, в который вошли записи речи более 200 тысяч людей. Датасет доступен по лицензии CC0 (общественное достояние), его можно использовать для разработки моделей распознавания и генерации речи. 

Объём собранного речевого материала в новой версии увеличился с 32,6 до 33,1 тыс. часов, количество поддерживаемых языков выросло с 129 до 133 (добавились записи на арагонском языке, а также языках исиндебеле, южный сото и тупури). Датасет содержит 3,6 тыс. часов речи на английском, 3,3 тыс. часов речи на русском, 1,8 тыс. на белорусском, 114 часов на украинском, 265 на узбекском.

Читать далее

В США подали в суд на Character.AI: чат-бот показывал детям непристойный контент и детально описывал селфхарм

Время на прочтение3 мин
Количество просмотров5.1K

Стартап Character.AI, разработчик одноимённого приложения с чат-ботами, столкнулся с иском от родителей двух несовершеннолетних пользователей. Истцы заявляют, что чат-бот компании показывал их детям непристойный контент и писал сомнительные сообщения, включая описание селфхарма и намёки на убийство родителей.

Читать далее

Alibaba представила открытую ИИ-модель QwQ-32B-Preview

Время на прочтение2 мин
Количество просмотров3.3K

Китайская Alibaba представила модель искусственного интеллекта с открытым исходным кодом под названием QwQ-32B-Preview. Она может решать сложные логические и математические задачи, содержит 32,5 млрд параметров и может обрабатывать запросы длиной до 32 тысяч слов. 

Читать далее

Яндекс наградил 14 учёных за достижения в сфере машинного обучения

Время на прочтение4 мин
Количество просмотров2.7K

В этом году мы в шестой раз вручили научную премию в области машинного обучения Yandex ML Prize. Совет премии выбрал 14 лауреатов, представивших наиболее перспективные и значимые работы в области генеративных моделей, обработки естественного языка, компьютерного зрения, информационного поиска, распознавания и синтеза речи, когнитивной робототехники.

Читать далее

GitHub запустил ИИ-модель Spark для генерации веб-приложений

Время на прочтение2 мин
Количество просмотров6.8K

GitHub анонсировал новый продукт под названием Spark — инструмент на базе искусственного интеллекта, который позволяет любому желающему создавать небольшие веб-приложения (sparks) с использованием естественного языка, даже без знаний основ программирования.

Читать далее

Ближайшие события

4 – 5 апреля
Геймтон «DatsCity»
Онлайн
8 апреля
Конференция TEAMLY WORK MANAGEMENT 2025
МоскваОнлайн
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань
20 – 22 июня
Летняя айти-тусовка Summer Merge
Ульяновская область

Character.ai обвиняют в самоубийстве подростка

Время на прочтение6 мин
Количество просмотров13K

Фрагмент переписки подростка-самоубийцы с его любимым персонажем Дейенерис. New York Times

Газета New York Times рассказала о самоубийстве подростка, который много, в том числе до момента смерти, общался с персонажем Character.ai. Сервису грозит реальное судебное разбирательство. Ещё до выхода статьи сайт Character.ai подготовил несколько улучшений безопасности.
Читать дальше →

Исследование: ИИ-модели лишь имитируют мышление человека

Время на прочтение2 мин
Количество просмотров6.9K

Группа исследователей ИИ в Apple опубликовала статью «Понимание ограничений математического рассуждения в больших языковых моделях» для общего обсуждения. Она посвящена концепциям символического обучения и воспроизведения шаблонов, но основная идея материала — ИИ не умеет думать как человек, а лишь имитирует мышление.

Читать далее

«Яндекс» обновил технологию фотоперевода на базе нейросетей

Время на прочтение1 мин
Количество просмотров1.8K

Компания «Яндекс» представила новую версию технологии перевода текста на фото и изображениях на базе нейросетей. Технология позволяет переводить текст на картинках, учитывая его контекст. Это будет особенно полезно, например, в путешествиях для понимания меню ресторанов или при работе с технической документацией на иностранных языках. 

«Яндекс» также усовершенствовал визуализацию перевода: текст теперь легче читается и больше похож на оригинальную вёрстку. Обновление уже доступно в «Переводчике» и «Браузере», а позже появится и в «Умной камере», сообщают в компании.

Читать далее

ИИ-редактор кода PearAI обвинили в копировании проекта Continue

Время на прочтение3 мин
Количество просмотров1.3K

Энтони Кларк

Основатель стартапа PearAI рассказал, что компания прошла отбор в инкубатор Y Combinator. Как замечают наблюдатели и как стартап признаёт сам, его главный продукт — это форк проекта Continue и редактора VSCode.
Читать дальше →

Калифорнийский университет в Беркли создал систему для анализа текстов DocETL

Время на прочтение5 мин
Количество просмотров1.6K

Система DocETL предлагает инструмент для создания и выполнения пайплайнов обработки данных, заточенных для анализа текстовых документов с помощью больших языковых моделей. Агентный подход помогает задействовать принципы low-code для описания операций. Код DocETL открыт, готовится научная статья о системе.

Читать далее

Проект по анализу использования языка людьми в интернете закрылся, потому что нейросети слишком загрязнили данные

Время на прочтение2 мин
Количество просмотров12K

Робин Спир, создательница проекта Wordfreq по анализу использования языка людьми в интернете, объявила о его закрытии. По её словам, нейросети слишком сильно загрязнили данные, из-за чего анализ стал невозможен.

Wordfreq — это программа, которая отслеживала, как люди используют более 40 различных языков, анализируя статьи в «Википедии», субтитры к фильмам и передачам, новости, книги и посты в соцсетях, таких как Twitter и Reddit. Система предназначена для оценки меняющихся языковых привычек, сленга и популярной культуры. На странице проекта на GitHub Робин Спир написала, что проект «больше не будет обновляться».

Читать далее

На платформе Coursera вышел новый курс Барбары Оакли: «Ускорьте свое обучение с ChatGPT»

Время на прочтение7 мин
Количество просмотров6.7K

Барбара Оакли - соавтор одного из самых популярных курсов за всю историю платформы Coursera: Learning How to Learn (3,85 млн зарегистрировавшихся учеников, 84,5 тыс отзывов). Недавно она в соавторстве с другим популярным на платформе преподавателем - Джулсом Уайтом (Jules White) - выпустила новый курс на схожую тему: Accelerate Your Learning with ChatGPT (https://www.coursera.org/learn/learning-chatgpt).

Курс достаточно короткий - всего два "модуля", 18 видео суммарной длительностью 2ч 40мин. В курсе практически нет других учебных материалов кроме видео.

В начале авторы дают вводную информацию по основам LLM и промпт-инжиниринга. Далее основная часть посвящена конкретным приемам использования ИИ в процессе обучения - всего их описано около десятка.

Под катом я поместил саммари курса, автоматически сгенерированное на основе субтитров с помощью Gemini 1.5 Pro (а точнее говоря, с помощью NotebookLM).

Читать далее