Machine Learning: Нейросети и машинное обучение
Über den Podcast
Подкаст «Machine Learning» – это захватывающее путешествие в мир нейросетей, машинного обучения и искусственного интеллекта, созданное для всех, кто хочет разобраться в технологиях, меняющих мир! Каждую неделю мы погружаемся в актуальные темы: от новейших архитектур нейросетей, таких как трансформеры, до применения ИИ в медицине, финансах, играх и творчестве. Вместе с ведущими экспертами, исследователями и практиками мы обсуждаем, как алгоритмы учатся, почему большие языковые модели вроде GPT революционизируют обработку данных, и какие этические дилеммы стоят за развитием ИИ.
Наши эпизоды – это не только глубокий разбор сложных концепций простым языком, но и реальные кейсы, вдохновляющие истории и прогнозы о будущем технологий. Хотите узнать, как обучить модель, избежать ловушек переобучения или интегрировать ИИ в свой проект? А может, вас волнует, заменят ли нейросети программистов или как обезопасить данные? Мы отвечаем на эти вопросы, делимся полезными инструментами, библиотеками и лайфхаками для разработчиков и энтузиастов.
"MachineLearning" – это место, где сложное становится понятным, а технологии – доступными. Слушайте нас, чтобы оставаться на волне инноваций, вдохновляться идеями и, возможно, найти свою нишу в мире ИИ! Подписывайтесь и присоединяйтесь к сообществу, где мы вместе исследуем, как нейросети формируют наше будущее. #ИИ #МашинноеОбучение #Нейросети #Технологии #Инновации
Genres und Tags
IPO OpenAI произойдет в 2027 году
Сэм Альтман сообщил сотрудникам, что выход на биржу откладывается на год. Поданный проспект эмиссии он назвал маневром для сохранения тактической свободы. В качестве альтернативы сотрудникам предложили выкупить их акции по цене $687,69 за штуку.
Задержка объясняется прогрессом в разработке самообучающегося ИИ. По мнению главы OpenAI, в период непредсказуемого развития технологий компании безопаснее оставаться непубличной.
Дополнительный фактор переноса - размещение акций Anthropic. Конкурент показывает лучшие метрики роста, тогда как OpenAI сжигает капитал.
В июне компания планирует выпустить новую модель с индексом 5.6, которую внутри оценивают как серьезный шаг вперед по сравнению с GPT-5.5.
Arcee AI переезжает из AWS на Hugging Face
Данные компании разместят в сервисе Hugging Face Buckets, который оснащен встроенной CDN и оптимизирован для работы с весами моделей.
Главная причина миграции в отсутствии платы за исходящий трафик. Единое хранилище позволит Arcee AI избежать вендор-лока и запускать обучающие кластеры у любых облачных провайдеров без затрат на перенос данных.
На Hugging Face лаборатория поддерживает более 200 проектов. Среди них - файнтюн SuperNova на базе Llama 3.1, семейство моделей Trinity и открытый датасет The-Tome, включающий 1,75 млн образцов для обучения ИИ-агентов.
NotebookLM получил среду для запуска кода, агентов и модель Gemini 3.5
Google обновила платформу NotebookLM. Система перешла на Gemini 3.5 и движок Antigravity, получила поддержку автономных агентов и возможность запуска кода.
Каждый блокнот теперь оснащается облачным инстансом, который включает более 100 скиллов для выполнения кода и анализа данных. В тестах новая архитектура превосходит предыдущую в 65% случаев по 5 ключевым метрикам.
В сервисе появилась возможность начинать исследования без загрузки данных через агентный поиск релевантных материалов. Результаты попадают в базу с сохранением атрибуции. Расширились форматы экспорта: PDF-отчеты с графиками, структурированные данные, таблицы Excel, презентации PowerPoint, а также изображения с помощью Nano Banana.
Обновление доступно пользователям с подпиской AI Ultra и корпоративным клиентам.
Cohere выпустила свою первую открытую кодинг-модель
North Mini Code - open-source модель для программирования и координации агентов, построена на архитектуре MoE с 30 млрд общих и 3 млрд активных параметров. Модель обучена управлять субагентами, проектировать архитектуру систем и проводить код-ревью.
В бенчмарке Artificial Analysis Coding Index новинка набрала 33,4 балла. В сравнении с Devstral Small 2 на аналогичной аппаратной нагрузке пропускная способность генерации текста выше в 2,8 раза. Задержка между токенами ниже на 30% при сопоставимом времени до вывода первого токена.
Веса опубликованы на Hugging Face. Тестовый доступ открыт через API и платформу Model Vault.
Warner Music Group приобрела разработчика цифровых отпечатков Sureel AI
Технология Sureel AI создает цифровые отпечатки аудиозаписей, декомпозируя их на базовые элементы. Алгоритмы определяют, попал ли контент артиста в тренировочный датасет ИИ-модели или использовался при генерации нового трека.
Дополнительный модуль системы выявляет дипфейки, клонирование голоса и копирование визуального стиля. Архитектура платформы поддерживает работу с видео и изображениями, в базе стартапа проиндексированы миллионы цифровых активов.
Лейбл сохранит проект как независимую платформу, рассчитывая сделать ее стандартом для музыкальной индустрии.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
Китай построит единую национальную вычислительную сеть
В ближайшие 5 лет Пекин планирует объединить разрозненные дата-центры страны в общую инфраструктуру для форсированного развития ИИ-отрасли.
Операционным управлением займутся телеком-гиганты China Mobile и China Telecom, которые должны обеспечить полную связность сети к 2028 году. С учетом модернизации энергосистем общие затраты на проект могут достичь полутриллиона долларов. Основное финансирование обеспечат выпуск гособлигаций и целевые фонды.
План жестко квотирует закупки - не менее 80% оборудования, включая ИИ-чипы, должно поставляться локальными производителями. Для NVIDIA и AMD это означает радикальное сокращение присутствия на китайском рынке.
Масштабная инфраструктурная стройка вошла в государственную стратегию "Шести больших сетей" и призвана обеспечить КНР независимость для лидерства в глобальной ИИ-гонке.
Google представила потоковую модель Gemini 3.5 Live Translate
Новинка генерирует аудио до окончания реплики спикера, балансируя между накоплением контекста и скоростью вывода. Алгоритм поддерживает более 70 языков и сохраняет оригинальную интонацию, темп и высоту голоса.
Технология сразу пошла в конечные продукты. Обновление разворачивается в мобильном Google Translate. Для корпоративных клиентов тестируется интеграция в Google Meet с поддержкой более 2000 языковых комбинаций в рамках одной конференции.
Превью-версия модели доступна в AI Studio и через Gemini Live API. Сгенерированные аудиодорожки маркируются SynthID.
Скоростная версия флагманской модели Xiaomi
Китайская компания выпустила модель MiMo-V2.5-Pro-UltraSpeed на 1 трлн параметров со скоростью вывода 1000 токенов в секунду.
Пропускной способности добились совместно с разработчиками фреймворка TileRT за счёт квантования в FP4 и спекулятивного декодирования DFlash. Скорость генерации выросла в 10 раз по сравнению с прошлыми версиями. Xiaomi позиционирует модель для систем автоматизированного принятия решений с минимальной задержкой.
Доступ к UltraSpeed API стоит в 3 раза дороже базовой MiMo-V2.5-Pro. Открытая версия с весами FP4 опубликована на HuggingFace.
С 9 по 23 июня проходит закрытое корпоративное тестирование облачной версии. В день выделяется 10 слотов на сессии до 30 минут, доступ предоставляется по заявкам.
Perplexity и Гарвард оценили ускорение работы от применения агентов
Гарвардская школа бизнеса и Perplexity опубликовали отчет об эффективности автономного агента Computer. По сравнению со стандартным поиском платформы агент экономит 87% времени на интеллектуальные задачи и снижает условные затраты на труд на 94% (на базе данных о зарплатах в США).
ИИ-поиск требует постоянных действий пользователя при средней сессии в 33 секунды, а основные часы съедает ручная работа человека. Агент Computer берет весь цикл на себя и работает автономно около 26 минут.
Опросы пользователей зафиксировали медианное ускорение рутины в 25 раз. Доля сессий с негативной оценкой результатов выдачи при переходе на агента снизилась с 2,9% до 1,3%.
В США готовятся запустить торговлю фьючерсами на компьют
Goldman Sachs и JPMorgan Chase разрабатывают фьючерсные контракты, привязанные к стоимости аренды GPU. Инструмент нужен для хеджирования рисков дефолта и обесценивания оборудования по кредитам, выданным на создание ИИ-инфраструктуры.
Чикагская товарная биржа и Межконтинентальная биржа планируют начать торги контрактами на компьют в этом году, если инициативу одобрит регулятор.
Механизм позволит банкам открывать короткие позиции для компенсации убытков при падении арендных ставок. Облачные провайдеры, в свою очередь, смогут фиксировать прибыль и защищаться от ценовой волатильности.
Пока регуляторы США оценивают механизмы защиты от манипуляций, на зарубежных площадках уже работают альтернативные платформы ставок на динамику стоимости аренды NVIDIA H100.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
OpenAI переделает ChatGPT в суперприложение
В ближайшие недели компания проведёт первый крупный редизайн ChatGPT с 2022 года. Сервис трансформируется из диалогового чат-бота в платформу автономных агентов.
Обновлённый интерфейс интегрирует партнёрские сервисы для самостоятельного выполнения многошаговых задач без дополнительных промптов и переключения между приложениями.
Смена курса обусловлена низкой рентабельностью чат-бота. Перед IPO OpenAI смещает фокус на B2B-сегмент и реструктуризирует продуктовые команды. Бизнес-модель переориентируется на корпоративных клиентов со стабильной монетизацией по аналогии со стратегией Anthropic.
Инженер из аппаратного подразделения OpenAI перешёл в Anthropic
Anthropic наняла бывшего инженера OpenAI Клайва Чана для разработки собственных ИИ-чипов. До этого у компании не было профильного аппаратного подразделения.
В OpenAI Чан проектировал кастомный кремний и участвовал в партнёрстве с Broadcom. До этого он разрабатывал чипы для обучения ML-моделей в Tesla Autopilot, где отвечал за архитектуру дата-центров и энергоэффективные вычисления.
Найм Чана должен помочь Anthropic сформировать команду аппаратных инженеров. Переход на собственное железо планируется для снижения себестоимости вычислений и повышения маржинальности.
TSMC испытывает дефицит производственных мощностей
Google заказала у Intel производство более 3 млн TPU на 2028 год. Nvidia пока не заключила контракт, но тестирует техпроцессы Intel для будущей GPU-архитектуры Feynman. Причина переноса заказов - из-за нехватки производственных линий у TSMC.
Глава TSMC подтвердил, что индустрия не сможет покрыть спрос на ИИ-чипы в ближайшие несколько лет. Дефицит позволил Intel привлечь новых клиентов на фоне прошлых финансовых убытков и срывов дедлайнов.
Параллельно SK Hynix проверяет совместимость своей памяти с новыми технологиями упаковки Intel.
Sakana AI займётся алгоритмической эволюцией ИИ
Японский стартап открыл исследовательскую лабораторию рекурсивного самосовершенствования (RSI). Цель - создание сетей, которые итеративно переписывают, тестируют и оптимизируют собственный код. Компания рассчитывает, что алгоритмическая эволюция позволит отказаться от парадигмы масштабирования вычислений.
В портфеле стартапа уже есть система LLM-Squared, где одни LLM создают алгоритмы обучения для других, и платформа AI Scientist, автоматизирующая научные исследования.
Следующий этап дорожной карты Sakana AI - разработка автономных агентов, способных улучшать свою архитектуру без участия человека.
Динамический биллинг лишил 74% бизнеса контроля над ИИ-бюджетами
По данным неопубликованного отчета KPMG, только 26% компаний полностью контролируют свои расходы на ИИ. 50% ведут ограниченный мониторинг, а 22% узнают о затратах постфактум из выставленных счетов. Причина - неготовность финансовых отделов к токенизированному биллингу и динамическому ценообразованию.
Из-за непрогнозируемой нагрузки потребление ресурсов в отдельных проектах возрастает до 6 раз. Это приводит к исчерпанию годовых бюджетов на облачные вычисления и API за несколько месяцев. По итогам текущего квартала ожидается пересмотр расходов после получения бизнесом реальных счетов от ИИ-провайдеров.
Текущую ситуацию сравнивают с закупками облачных мощностей во время пандемии, за которыми последовало сокращение инфраструктурных бюджетов.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
Mythos все-таки стала инструментом для наступательных киберопераций США
АНБ США начало применять модель Mythos для взлома зарубежных сетей, предположительно в Китае и Иране. Для адаптации системы под задачи спецслужбы Anthropic направила в агентство команду из 6 инженеров.
Сотрудничество с АНБ стало исключением на фоне конфликта стартапа с Пентагоном. В правилах безопасности Anthropic жесткие ограничения на военное использование ИИ касаются слежки за гражданами США, но формально оставляют спецслужбам свободу действий в операциях против зарубежных целей.
Степень вовлеченности разработчиков Anthropic в активные фазы атак не раскрывается.
Власти Флориды подали в суд на OpenAI и Сэма Альтмана
В 83-страничном документе прокуратура штата требует признать ChatGPT дефектным товаром и общественной угрозой из-за выдачи опасного контента несовершеннолетним.
Часть обвинений строится на внутренних утечках. По версии властей, Альтман намеренно сократил сроки тестирования безопасности GPT-4o перед релизом. Утверждается, что на выявление рисков OpenAI выделила 1–2% вычислительных мощностей вместо публично обещанных 20%.
Дополнительные претензии касаются приватности. В иске указано, что в бесплатной версии ChatGPT нет верификации возраста, а сбор пользовательских данных начинается до принятия Terms of Service.
В мобильном клиенте LM Studio появилась поддержка удаленного инференса
Обновлённый клиент для iPhone и iPad объединил локальный инференс на смартфоне и удаленный доступ к десктопным моделям.
Офлайн-режим построен на фреймворке Apple MLX и оптимизирован под чипы Apple Silicon. Приложение поддерживает загрузку весов в формате GGUF.
Запуск тяжелых моделей стал возможен благодаря функции LM Link. Она направляет запросы к десктопному хосту LM Studio через mesh-сеть на базе Tailscale. Интеграция обеспечивает сквозное шифрование трафика без проброса портов в интернет.
Учёные Кембриджа отчитались о тестировании спроектированной ИИ вакцины
Университет завершил первую фазу клинических испытаний pEVAC-PS, вакцины против коронавирусов, архитектуру которой спроектировала ИИ-модель. Препарат подтвердил безопасность и вызвал перекрестный иммунный ответ к нескольким видам вирусов у 39 добровольцев.
Модель обучали на генетических данных сарбековирусов, включая SARS-CoV-2 и вирус атипичной пневмонии. Алгоритм вычислил общую для родственных патогенов мишень, уязвимую для человеческих антител.
Клиническую эффективность pEVAC-PS проверят на втором этапе исследований. Технологию планируют применять для разработки вакцин против гриппа и вируса Эбола. Для коммерциализации платформы команда Кембриджа основала компанию DIOSynVax.
Человеческий контроль мешает бизнесу экономить на внедрении ИИ
По данным опроса Bain & Company среди 951 компании, постоянное вмешательство людей в работу алгоритмов снижает финансовую отдачу от внедрения ИИ. Почти 40% корпораций сократили издержки менее чем на 10%, не достигнув целевых показателей в 11–20%.
Лишь 7% респондентов используют полностью автономных агентов. В 38% случаев системы требуют обязательного подтверждения каждого действия со стороны человека. Это ломает исходные бизнес-кейсы, рассчитанные на автоматизации.
Вторым барьером для интеграции моделей 41% опрошенных назвали проблемы с доступом к корпоративным данным. Несмотря на отставание от финансовых планов, 90% компаний намерены наращивать инвестиции в ИИ.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
ChatGPT получил динамическое обновление контекста
OpenAI начала развертывание автоматической фоновой памяти для ChatGPT в США на тарифах Plus и Pro. В основе системы лежит механизм фоновой организации данных Dreaming.
Модель самостоятельно извлекает контекст, детали рабочих проектов и предпочтения из множества сессий без прямых команд на запоминание. Главное отличие новой архитектуры - динамическое обновление фактов.
Алгоритм актуализирует информацию со временем, понижая значимость устаревших данных. Прежняя реализация памяти полагалась на статичные факты, требовавшие ручного управления.
В ближайшие недели OpenAI расширит географию доступа и откроет функцию для пользователей бесплатных аккаунтов.
xAI открыла API модели Grok Imagine Video 1.5
Компания выпустила превью-версию модели Grok Imagine Video 1.5 для генерации 720p-видео по картинке. Релиз позиционируется как конкурент Seedance и Google Veo.
Модель анимирует изображение по текстовым промптам: задается направление движения камеры, динамика и атмосфера сцены. Алгоритм сохраняет оригинальную детализацию и схему освещения исходника.
Также поддерживается склейка нескольких планов в длинные ролики с сохранением визуальной консистентности. Доступ к новинке открыт через API.
Nvidia купила ИИ-стартап Kumo
Сделка оценивается в 400 млн долларов. Наработки Kumo интегрируют в платформу Nvidia AI Foundry, где корпоративные клиенты смогут обучать кастомные модели на внутренних реляционных базах.
Стек Kumo адаптирован для анализа сложных структур из множества связанных таблиц, которые тяжело обрабатывать классическими LLM. Алгоритмы комбинируют графовое машинное обучение и генерацию синтетических данных. Платформа решает задачи предиктивной аналитики: от прогнозирования оттока пользователей до оценки вероятности финансовых дефолтов.
В рамках сделки в Nvidia перейдет команда стартапа. Среди действующих клиентов Kumo - DoorDash, Reddit, Databricks и Snowflake. Актуальная модель стартапа вышла в апреле этого года.
Релиз Reve 2.0: генерация 4K-изображений через редактируемые макеты
Reve представила новый генератор картинок на архитектуре Large Layout Model. Система отходит от классической генерации по тексту и работает через макеты: каждый визуальный элемент получает точные координаты, размер и описание.
Модель прошла дополнительный пространственный претрейн на базе Qwen. Изображение представляется как код, что позволяет управлять результатом через промпт или точечно редактировать JSON-структуру макета.
По заявлению авторов, на обучение ушло в 10 раз меньше вычислительных мощностей по сравнению с корпоративными аналогами. Модель занимает вторую строчку в бенчмарке Text-to-Image ArenaAi, обходя Nano Banana 2 и GPT-Image-1.5.
Трафик ботов и ИИ-агентов впервые превысил активность людей
По данным Cloudflare, доля машинного веб-трафика достигла 57,5%, превысив активность людей (42,5%). По словам гендиректора компании Мэттью Принса, рубеж пройден на несколько лет раньше прогнозируемого 2027 года.
Рост обусловлен не классическими скриптами (краулеры, спам, DDoS-сети), а автономными ИИ-агентами. Алгоритмы парсят контент для обучения нейросетей и выполняют многошаговые задачи от лица пользователей: мониторят цены, взаимодействуют со службами поддержки и оформляют заказы.
Cloudflare классифицирует трафик верифицированных ботов и ИИ-агентов отдельно с прошлого года. Точную дату превышения машинного трафика над человеческим определить сложно из-за специфики метрик.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
Google выпустила Gemma 4 12B
DeepMind опубликовала веса мультимодальной модели Gemma 4 12B, которая обрабатывает текст, изображения и аудио без использования отдельных энкодеров.
Отказ от внешних модулей снизил вычислительную задержку и требования к памяти. Модель работает локально на устройствах с 16 ГБ ОЗУ, показывая в бенчмарках результаты на уровне моделей класса 26B.
Веса выложены на Hugging Face, поддержка модели добавлена в Ollama и LM Studio. Лицензия Apache 2.0, допускающая коммерческое применение.
Ideogram релизнул четвертую версию T2i модели
Ideogram 4.0 получила поддержку разрешения 2K, создание прозрачного фона и позиционирование объектов через bounding boxes. Сохранен фокус на качественном рендеринге текста для логотипов и постеров.
На DesignArena, модель заняла 1 место среди открытых решений, уступив только проприетарным системам OpenAI и Google.
Код и веса опубликованы в открытом доступе. Для коммерческого применения требуется покупка платной лицензии.
Доступен API стоимостью от $0.03 до $0.10 за генерацию в зависимости от качества. Модель есть на площадках ComfyUI, Replicate и Leonardo AI. В будущих обновлениях обещают добавить работу со слоями и редактируемый текст.
Personal Computer от Perplexity стал доступен на Windows
Система напрямую взаимодействует с локальными файлами, системными утилитами и десктопными приложениями Microsoft (Word, Excel, PowerPoint, Outlook).
Архитектура разбивает запросы на подзадачи и распределяет их между пулом агентов. Personal Computer сортирует директории, переносит метрики из локальных таблиц в презентации и сверяет документы с веб-выдачей.
В интеграции с браузером Comet агент управляет интерфейсами сайтов: заполняет формы, бронирует слоты в календаре и работает с корпоративными платформами. Поддерживается синхронизация - запущенную на смартфоне задачу можно продолжить на ПК. Продукт доступен по листу ожидания для подписчиков Max и Enterprise Max.
Nous Research представила ИИ-агента Hermes Desktop
Hermes Desktop - превью-версия приложения под лицензией MIT для развертывания ИИ-агентов на Windows, macOS и Linux. Инструмент работает из терминала, электронной почты и мессенджеров.
Hermes планирует задачи на естественном языке и использует постоянную память для сохранения контекста проектов. Архитектура поддерживает делегирование: система запускает субагентов с отдельными терминалами для выполнения Python-скриптов, веб-поиска, генерации изображений и синтеза речи.
Для изоляции исполняемого кода доступны пять песочниц: локальная среда, Docker, SSH, Singularity и Modal. Обращения к LLM маршрутизируются через платформу Nous Portal, на которой есть более 300 моделей, в том числе по бесплатным тарифам.
MIT собрали набор для обучения моделей анализу графиков
Институт в коллаборации с IBM Research представили ChartNet - синтетический датасет из 1,5 млн диаграмм для обучения vision-моделей.
Авторы конвертировали существующие графики в исполняемый код, а затем программно модифицировали его для генерации новых примеров. Датасет включает 24 типа диаграмм на базе 6 библиотек визуализации. Каждый сэмпл содержит сгенерированное изображение, исходный код, таблицу данных и текстовое описание.
По заявлению разработчиков, дообучение на ChartNet позволило компактным моделям превзойти более крупные проприетарные системы в профильных бенчмарках по извлечению визуальной информации.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
США ввели добровольную проверку закрытых ИИ-моделей перед релизом
Президент США подписал указ о кибербезопасности в сфере ИИ. Разработчикам передовых закрытых моделей предлагают добровольно предоставлять государству доступ к продуктам за 30 дней до релиза для аудита безопасности и поиска уязвимостей.
Изначальный 90-дневный период проверки сократили по требованию IT-индустрии. Финальный документ прямо запрещает вводить обязательное государственное лицензирование и принудительную премодерацию.
Одновременно Минфин, Пентагон и АНБ создадут совместный координационный центр. Структура займется защитой правительственной IT-инфраструктуры: автоматизирует сканирование федеральных систем и будет координировать противодействие кибератакам с использованием нейросетей.
OpenAI добавила в Codex нетехнические плагины
Компания выпустила обновление Codex для пользователей без технического бэкграунда. В продукт добавили 62 ролевых плагина и 110 функций для аналитиков, дизайнеров, инвестбанкиров и специалистов по продажам.
Среди новых инструментов - Sites для конвертации отчетов в интерактивные веб-страницы и Annotations для редактирования фрагментов текста или таблиц через промпты.
Платформа открыта для сторонних разработчиков. Первыми партнерами по интеграции стали Wix, Figma и Replit. Планируется релиз плагинов для корпоративных финансов, консалтинга и юриспруденции.
Прирост нетехнической аудитории в 3 раза опережает рост базы разработчиков, OpenAI отчиталась о еженедельной аудитории в 5 млн человек.
Anthropic привлекла ещё 150 организаций к проекту Glasswing
К инициативе по поиску уязвимостей в критической инфраструктуре (энергетике, водоснабжении, здравоохранении и связи) присоединились 150 организаций из 15 стран.
По данным компании, первые 50 участников выявили с её помощью более 10 тысяч багов. Доступ к технологии также может получить Агентство ЕС по кибербезопасности. Anthropic планирует открыть широкий доступ к Mythos в ближайшие недели после внедрения систем защиты.
По прогнозам компании, генеративные модели уровня Mythos от конкурентов появятся через 6–12 месяцев.
Perplexity меняет архитектуру ИИ-поиска
ИИ-поисковик представил архитектуру Search as Code, в которой модели компании работают как планировщики: они анализируют задачу и генерируют Python-код для создания поисковых пайплайнов.
Процесс состоит из 3-х уровней: LLM управляет логикой и пишет код, скрипт выполняется в песочнице для фильтрации, агрегации и дедупликации данных, а за извлечение, парсинг и ранжирование информации отвечает инструмент Agentic Search SDK.
Агенты могут запускать параллельные запросы и динамически корректировать стратегию. Search as Code позволяет обрабатывать сырые данные программными алгоритмами в песочнице до их передачи в языковую модель, что предотвращает перегрузку контекстного окна LLM.
SK Hynix удвоит производство полупроводниковых пластин в ближайшие 5 лет
Председатель SK Group заявил на конференции Computex, что расширение связано со спросом на высокопроизводительную память для ИИ-ускорителей. По прогнозам руководства, дефицит комплектующих на этом рынке сохранится до 2030 года.
Главным партнером SK Hynix остается Nvidia, южнокорейский вендор планирует стать основным поставщиком HBM для будущей архитектуры Rubin. Сроки внедрения следующего стандарта памяти, HBM4E, также напрямую зависят от Nvidia, которая пока выступает его единственным заказчиком.
Глава чипмейкера также предостерег индустрию от завышения цен на HBM и DRAM. По его словам, резкий рост стоимости памяти подорвет долгосрочное развитие ИИ-экосистемы.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
Anthropic подала заявку на проведение IPO
Создатель Claude направил финансовому регулятору предварительный проект заявления на проведение IPO. Сроки листинга, объем выпускаемых бумаг и ценовой диапазон не утверждены - выход на биржу зависит от рыночной конъюнктуры.
Заявке предшествовал раунд финансирования на $65 млрд, после которого оценка стартапа приблизилась к $1 трлн.
Юридически Anthropic зарегистрирована как Public Benefit Corporation, что обязывает компанию балансировать между извлечением прибыли и общественной пользой.
SoftBank построит во Франции ИИ-ЦОД мощностью 5 ГВт
Проект стоимостью 45 млрд евро анонсирован на саммите Choose France.
На первом этапе к 2031 году в регионе О-де-Франс развернут мощности на 3,1 ГВт. К реализации привлекли локальных партнеров: Schneider Electric развернет производственный кластер компонентов для ЦОД, а стартап Sesterce поможет со строительством. Локация выбрана из-за стабильного доступа к энергосети и местной технологической экосистемы.
Новые ЦОД дополнят глобальную инфраструктуру SoftBank. Компания уже участвует в строительстве гигаваттного дата-центра в Абу-Даби, финансирует обучение суверенной модели на 1 трлн параметров в Японии и открывает центры проектирования чипов в Южной Корее.
Codex получила функцию автономного управления ПК на Windows
Инструмент Computer Use, ранее доступный только на macOS, позволяет модели самостоятельно взаимодействовать с файлами и системными ресурсами.
Обновление нацелено на автоматизацию тестирования софта, поиска багов и проверки кода. Навигация и вызов приложений осуществляются через специальные текстовые теги.
Удаленный доступ к Codex интегрировали в мобильное приложение ChatGPT для iOS и Android. Пользователи могут ставить задачи и мониторить процессы на рабочей станции со смартфона.
Nemotron 3 Ultra стала самой мощной открытой моделью из США
Nvidia анонсировала открытую MoE-модель Nemotron 3 Ultra с архитектурой на 550 млрд параметров, из которых 55 млрд активны при генерации.
По оценке Artificial Analysis, модель обошла Gemma 4 и gpt-oss-120b. Выше в рейтинге остаются китайская Kimi K2.6 и закрытые флагманы уровня Opus 4.8.
Скорость Nemotron 3 Ultra при тестировании через провайдера DeepInfra превышает 300 токенов в секунду. Открытые модели сопоставимого размера от DeepSeek и Moonshot генерируют 50–100 токенов. Релиз на Hugging Face, OpenRouter и других площадках запланирован на 4 июня.
Топ-менеджер Apple перешла в OpenAI
Директор по машинному обучению и ИИ Apple Келси Петерсон перешла в OpenAI. По данным журналиста Bloomberg Марка Гурмана, уход состоялся за неделю до WWDC 2026, где планируется презентация обновленного голосового ассистента.
Петерсон работала в Apple с 2015 года и отвечала за внедрение Apple Intelligence в Siri. На WWDC 2024 она проводила первую демонстрацию помощника с поддержкой кросс-апп контекста и многоэтапных задач. Позже релиз перенесли для доработки стандартов качества проекта.
Презентацию новой версии Siri 8 июня проведет другой спикер.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
OpenAI открыла доступ к биологической модели GPT-Rosalind
Компания запустила программу Rosalind Biodefense и открыла бесплатный доступ к специализированной модели GPT-Rosalind. OpenAI полностью покроет расходы на использование модели для верифицированных команд.
Подать заявку могут академические, некоммерческие и государственные лаборатории, а также небольшие профильные стартапы.
Представленная в апреле GPT-Rosalind обучена для анализа молекул, белков, генов и механизмов заболеваний. Цель инициативы - ускорить переход от научных гипотез к реальным экспериментам в сфере биозащиты.
openai.com
Google Cloud запустила систему AI Threat Defense
Новая платформа самостоятельно находит уязвимости в коде, пишет и внедряет патчи.
В основе - технологии стартапа Wiz для картирования IT-среды и приоритизации реальных векторов атак. Мониторинг обеспечивают несколько ИИ-моделей: легковесные ведут непрерывный анализ сети, а ресурсоёмкие активируются только для проверки критических узлов.
За исправление отвечает ИИ-агент Codemender от DeepMind. При обнаружении уязвимости он заменяет проблемный код в среде разработки. Заявлена возможность рефакторинга legacy-архитектур на современные языки программирования. Перед деплоем патча платформа автоматически генерирует тесты для проверки внесённых изменений.
NVIDIA переводит все свои открытые модели на единую лицензию от Linux Foundation
На лицензию OpenMDW-1.1 переходят 4 семейства: Cosmos, Isaac GR00T, Ising и Nemotron.
Стандарт разработан Linux Foundation для ИИ-индустрии и одним документом покрывает все компоненты релиза: исходный код, датасеты, веса, метаданные и документацию. Лицензия позволяет делать дообученные модели и производные продукты проприетарными.
Разработчики получают права на коммерциализацию, модификацию и распространение моделей. Единственное требование - сохранение оригинальных копирайтов при дистрибуции.
NVIDIA в сети Х
ElevenLabs представила вторую версию модели синхронного перевода
Dubbing v2 предназначена для перевода речи на 90+ языков с клонированием голоса и сохранением эмоций оригинала.
Модель перешла на архитектуру speech-to-speech: аудио обрабатывается напрямую без промежуточной конвертации в текст. Она сохраняет тембр, интонации и темп спикера, автоматически синхронизируя перевод с таймингами и паузами исходного видео. Алгоритм генерирует контекстную адаптацию фраз вместо дословного перевода, не требуя ручной корректировки.
База поддерживаемых языков расширена с 29 до более чем 90. Инструмент доступен в двух форматах: ElevenCreative (платформа для креаторов и маркетологов) и ElevenProductions для киностудий и бродкастеров. Публичный API для готовится к релизу.
elevenlabs.io
Genesis AI опубликовала открытый симулятор роботов
Genesis World - симулятор для робототехники, который позволяет генерировать 100 дней симуляции за один час вычислений.
В платформу встроены кастомные солверы, объединяющие физику твердых и деформируемых тел и предотвращающие взаимопроникновение мешей. Вычисления обрабатывает кроссплатформенный GPU-компилятор Quadrants, а за генерацию данных для СV отвечает движок Nyx с поддержкой трассировки пути.
В симуляторе есть профили Unitree, Sharpa, Wuji и различных робототехнических захватов. Genesis World рассчитывает сложные физические контакты в режиме, близком к реальному времени, и позволяет тестировать модели для прямого sim-to-real переноса политик на физических роботов.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
В Claude Code добавили динамические воркфлоу и профиль ultracode
Обновление позволяет писать JavaScript-скрипты для оркестрации субагентов в рамках одной сессии. Скрипты берут на себя логические ветвления и хранение промежуточных результатов.
Для сложных задач добавлен профиль конфигурации ultracode. В нем модель самостоятельно решает, когда запустить мультиагентный пайплайн для перекрестного код-ревью и автоматического исправления ошибок.
Воркфлоу доступны через CLI и расширения для IDE на тарифах Max и Team. Инструмент кратно увеличивает расход токенов.
Mistral провела ребрендинг LeChat
Французский ИИ-стартап обновил чат-бота Le Chat, переформатировав его в автономного агента Vibe, который интегрируется с Google Workspace, Outlook, Slack, GitHub, SharePoint и Notion.
Агент сканирует почту, парсит таблицы и верстает отчеты, предварительно согласовывая пошаговый план действий. Сценарии можно автоматизировать по расписанию или сохранять как шаблоны.
Появился Code Mode, где агенты работают в изолированных песочницах: пишут код, исправляют баги, создают тесты и доводят задачу до открытия PR. Фоновые сессии выполняются параллельно и не зависят от локального устройства.
Доступна бесплатная версия и тарифы: Pro (15 евро), Team (25 евро) и Enterprise. Точные лимиты не раскрываются - квоты подписок указаны как кратные множители.
mistral.ai
Google анонсировала одноплатник на базе RISC-V
Google показала одноплатный компьютер Coral Board для локального запуска модели Gemma 3 270M.
В основе платы - открытый нейромодуль Coral NPU на архитектуре RISC-V от Google Research. Вычислительным ядром выступает SoC Synaptics Astra SL2619: двухъядерный процессор с частотой 2 ГГц, 2 ГБ оперативной памяти и производительностью 1 TOPS. Этого объема ресурсов хватает для инференса компактной LLM.
Плата спроектирована для интеграции в AR-очки, умные часы и наушники. На презентации показали работу синхронного переводчика, голосовое управление периферией и генерацию звука в реальном времени - модель YOLOv8 отслеживала движения медуз и конвертировала их в музыку.
Исходный код демо-проектов выложен на GitHub. Поставки стартуют летом, цена пока неизвестна.
YouTube начнет автоматически помечать ИИ-контент
Алгоритмы видеохостинга будут принудительно добавлять предупреждающую плашку при выявлении генерации, если создатель не указал это сам.
Маркировка станет жестко привязанной и неудаляемой для медиафайлов с метаданными стандарта C2PA, а также для роликов, созданных в Veo и Dream Screen. При ложном срабатывании решение можно оспорить через YouTube Studio.
Визуально метки разместятся под плеером в длинных видео и поверх контента в Shorts. Наличие плашки не влияет на монетизацию и алгоритмы рекомендаций.
Дополнительно YouTube делает общедоступным инструмент Likeness Detection для поиска дипфейков, систему откроют для авторов старше 18 лет.
blog.youtube
Amazon запустил фонд и платформу для ИИ-видеопродакшена
Amazon MGM Studios и AWS запустили фонд GenAI Creators и платформу Project Nara для ИИ-видеопроизводства. Участники грантовой программы получат финансирование и доступ к новой облачной инфраструктуре.
Project Nara автоматически маршрутизирует задачи и подбирает модель для каждого этапа генерации. Платформа комбинирует сторонние видеомодели и проприетарные решения Amazon, обученные на контенте студии.
Инфраструктура интегрирует ИИ-агентов напрямую с Maya, Blender, Nuke, Unreal Engine и пакетом Adobe. Встроенная система трекинга документирует происхождение всех сгенерированных ассетов для контроля авторских прав.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения