Внедрение технологий ИИ в жизнь (программы, устройства, услуги)

К робопсу Boston Dynamics Spot подключили ChatGPT и превратили его в экскурсовода

Компания Boston Dynamics обучила робопса Spot выступать в роли гида по своей лаборатории и проводить экскурсии от имени разных персонажей — для этого к машине подключили чат-бот на базе искусственного интеллекта ChatGPT.

bd-spot.jpg

Источник изображения: bostondynamics.com

К роботу-собаке Spot подключили динамки, микрофон и API ChatGPT, который превратил его в интересного собеседника. Чтобы ещё больше оживить образ машины, разработчики добавили к ней вместо рта роботизированный манипулятор, на котором закрепили небольшой головной убор и пару пластиковых глаз. В качестве образца экскурсии разработчики написали базовые сценарии для каждого помещения в лаборатории — к примеру, робот показывал посетителям свою зарядную док-станцию. Spot также обучили делать снимки помещений и отвечать на вопросы о том, что он видит. Наконец, ему предложили проводить экскурсии от имени разных персонажей: гида-британца времён Шекспира, девочки-подростка и саркастичного Джоша (Josh).

Для просмотра ссылки Войди или Зарегистрируйся
Spot говорил людям комплименты, на ходу сочинял стихи и успешно отвечал на вопросы, которых даже не было в сценарии: когда его попросили показать родителей, они привёл посетителя к выставленным роботам Spot предыдущего поколения. Не обошлось и без сбоев: иногда он говорил не соответствующие действительности вещи; а один раз проигнорировал реплику собеседника, продолжил свой рассказ и отреагировал лишь спустя какое-то время.

Источник: Для просмотра ссылки Войди или Зарегистрируйся
 
Загадочный заменитель смартфона Humane Ai Pin будет стоить $1000 и получит ИИ-модель GPT — анонс состоится 9 ноября

Загадочное носимое устройство Ai Pin на базе искусственного интеллекта может получить ценник в $1000 и, возможно, будет требовать дополнительной ежемесячной подписки за услуги сотовой связи, сообщает издание The Information. Напомним, что разработкой данного гаджета занимается стартап Humane, созданный выходцами из Apple.

humane.jpg

Источник изображения: TED

Разработка устройства ведётся уже несколько лет. Однако первые детали о нём стали известны в апреле этого года, в рамках конференции TED. Тогда соучредитель компании Humane Имран Чаудри (Imran Chaudhri) мельком показал загадочное устройство в нагрудном кармане своей куртки и продемонстрировал его работу. Он ответил на телефонный звонок своей жены и соучредителя компании Бетани Бонджорно (Bethany Bongiorno), для чего не пришлось нажимать никаких кнопок — достаточно было простого «алло». Гаджет перевёл произнесённую своим владельцем фразу на французский язык, озвучив перевод его же голосом. Наконец, устройство показало, что умеет следить за электронной почтой, сообщениями и событиям календаря, правда, изобретатель тогда не уточнил, как именно это работает. Предполагалось, что больше деталей об Ai Pin будет раскрыто 14 октября. Однако дата презентации устройства была перенесена на 9 ноября. Теперь выяснились свежие подробности.

sm.6c8cedae81.800.jpg

Источник изображения: The Information

Судя по всему, это Ai Pin будет представлять собой не кольцо, как можно было предположить исходя из фотографий с апрельской презентации TED. Издание описывает гаджет, как «небольшое устройство без экрана размером с солёный крекер». Гаджет «получит камеру, микрофон и динамик, множество сенсоров, а также лазерный проектор». В начале октября устройство показывали на Неделе моды в Париже.

qwdqfqwgfwgwegweg.jpg


Гаджет предполагается крепить к одежде. Устройство работает на базе мобильного процессора Qualcomm Snapdragon, «который обеспечивает производительность, скорость беспроводного соединения и возможности камеры, а также безопасности, уровня смартфона». Humane планирует стать виртуальным оператором сотовой связи (то есть будет работать на базе инфраструктуры другого оператора связи) для предоставления сотового подключения для Ai Pin. Другой соучредитель компании Бетани Бонджорно (Bethany Bongiorno) описала устройство, как «телефон, контекстуальный компьютер и программная платформа».

sm.best-inventions-2023-humane-ai-pin.800.jpg

Источник изображения: Time

По данным The Information, работа ИИ-функций Ai Pin будут обеспечиваться проприетарной большой языковой моделью. Согласно статье издания Time, это будет GPT-модель от компании OpenAI. К слову, крупнейшим инвестором компании Humane является Сэм Альтман (Sam Altman), гендиректор OpenAI. К разработке самого устройства, предположительно, приложил руку Джони Айв (Jony Ive), бывший главный дизайнер продуктов Apple, покинувший её в 2019 году и после этого основавший свою собственную дизайнерскую фирму LoveFrom. В изначальной версии статьи Time утверждалось, что Ai Pin будет использовать GPT-4, однако в отредактированной версии статьи версия языковой модели была убрана. Публикация Time также описывает наличие у устройства индикатора, который включается при активации камеры, микрофона и «сенсоров ввода».

Многие детали об Ai Pin, а также о планах самой Humane по-прежнему неизвестны. По мнению источников The Information, у компании грандиозное видение технологий и её цели не ограничиваются одним Ai Pin. «Они предполагают, что Humane надеется добиться полной смены парадигмы в сегменте потребительских вычислений», — пишет издание. Как бы то ни было, больше подробностей об Ai Pin можно будет узнать 9 ноября.

Источник: Для просмотра ссылки Войди или Зарегистрируйся
 
Samsung рассказала о технологии ISOCELL Zoom Anyplace для масштабирование кадра при видеосъёмке без потери качества

Одной из интересных новых возможностей процессора Qualcomm Snapdragon 8 Gen 3 стала поддержка функции ISOCELL Zoom Anyplace — её разработала компания Samsung для смартфонов с 200-мегапиксельными сенсорами. Это решение позволяет автоматически отслеживать движущиеся объекты при видеосъёмке и масштабировать картинку без потери качества.

isocell-zoom-anyplace.jpg

Источник изображения: samsung.com

Технология ISOCELL Zoom Anyplace позволяет пользователю во время съёмки видео на смартфон выбрать интересующий объект, чтобы камера самостоятельно его отслеживала — фокусироваться на объекте самостоятельно больше не требуется. Функция основана на алгоритме искусственного интеллекта и поддерживается процессором Qualcomm Snapdragon 8 Gen 3. Даже если объект движется очень быстро, он остаётся в кадре, а оператору не требуется перемещать смартфон самостоятельно, значит, изображение не дёргается.

Ещё одним преимуществом ISOCELL Zoom Anyplace является динамическое масштабирование картинки прямо во время видеосъёмки: если раньше увеличенный объект проигрывал в качестве полному кадру, то с новой функцией это в обоих случаях настоящее разрешение 4K без ущерба качеству. Более того, поддерживается одновременная съёмка полной сцены и её фрагмента в высоком разрешении, то есть в большем числе ракурсов. Поддерживается и динамическое масштабирование: можно начать съёмку с «наезда» на объект, после чего постепенно уменьшить его в кадре или сделать наоборот.

Для просмотра ссылки Войди или Зарегистрируйся

Функция ISOCELL Zoom Anyplace поддерживает масштабирование без ущерба для качества: прежде цифровой четырёхкратный зум для 12,5-мегапиксельной картинки приводил к изображению с разрешением 0,78 мегапикселя (12,5 Мп / 16), но с 200-мегапиксельным сенсором таких жертв уже не требуется. Нужная оператору область выбирается из всего кадра и перерисовывается, а сенсор работает в исходном разрешении. Не потребуется и смена камеры, которая ранее производилась при масштабировании более трёхкратного — из-за этого менялись качество картинки и угол обзора. Сенсору на 200 мегапикселей это не требуется ни при двух-, ни при четырёхкратном увеличении.

Qualcomm Snapdragon 8 Gen 3 обеспечит Samsung работу ещё одной технологии под названием End-to-End (E2E) AI Remosaic. Традиционная схема съёмки включает несколько этапов: получение исходного изображения с сенсора, его обработка ISP (Image Signal Processor) и вывод результата в формате JPEG — все они выполняются последовательно. E2E AI Remosaic предполагает выстраивание и обработку изображения параллельно, то есть готовый результат получается вдвое быстрее. Пользователи делают снимки оперативнее, а качество фото страдает меньше, поскольку из-за задержек больше нет потери данных. Новые функции, вероятно, дебютируют с выходом смартфонов серии Samsung Galaxy S24 — их анонс ожидается в начале 2024 года.

Источник: Для просмотра ссылки Войди или Зарегистрируйся
 
Создан искусственный интеллект, который будет участвовать в конференциях за вас.
Едва появившись на свет, он уже нарушает законы


1 ноября пользователям Microsoft 365 станет доступен виртуальный ИИ-помощник, который способен подготовить выжимку из почтовой переписке и написать ответ за считанные секунды, а также легко готовит презентации в PowerPoint.

Ответственное отношение
Microsoft внедрила в свои офисные приложения помощника с искусственным интеллектом (ИИ), напоминающего по своим возможностям ChatGPT, - Microsoft 365 Copilot. Среди его возможностей - суммирование содержания встреч в Microsoft Teams, подготовка презентаций и восторженных ответов в почте.

В Microsoft утверждают, что это поможет снизить рутинную нагрузку на работников, однако уже раздаются голоса о том, что такой ИИ очень скоро сможет претендовать на замену многих работников собой.

27_10_23_copilot_700.jpg

Фото: kenshinstock / Фотобанк Фрипик
Искусственный интеллект выполняет функции офисного работника

Мало того, в его нынешнем виде этот ИИ может противоречить требованиям законодательства и ЕС, и Китая - о том, в частности, что при общении с искусственным интеллектом, человек должен сразу получать информацию о том, кто является его или ее собеседником.

Руководитель подразделения Microsoft 365 Колетт Столлбаумер (Colette Stallbaumer) заявила, что Copilot - это лишь инструмент, и что за ответственное его использование отвечает тот, кто им пользуется. «Я, быть может, не стану уточнять, что для подготовки ответа на ваш запрос я использовала ИИ-помощника. В этом уравнении всегда присутствует человек, и именно он все контролирует», - дополнила Колетт Столлбаумер.

Европейские регуляторы, однако, считают иначе: по их представлениям, эту задачу должны решать вендоры ИИ-технологий.

Возврат инвестиций
С технической точки зрения Copilot базируется на той же технологии, на которой и OpenAI ChatGPT, благо Microsoft инвестировала в нее миллиарды долларов.

Как пишет журналист BBC Зоуи Клайнман (Zoe Kleinman), Copilot оставляет двойственное впечатление: с одной стороны, это эффективный инструмент, а с другой - конкурентная опасность для многих офисных работников. В особенности в тех компаниях, которые стремятся сократить издержки.

Copilot с успехом справляется с такими задачами, как суммирование содержания длинной цепочки электронных сообщений, посвященных запуску (вымышленного) продукта, а затем предлагает короткий ответ. На все уходят секунды.

«Мы воспользовались простым выпадающим меню и проинструктировали чатбота написать более длинное и казуальное сообщение, и он сгенерировал очень теплый ответ с выражением восхищения высказанными в переписке идеями и радости от участия в проекте - хотя никто из нас не прочитал ни одного сообщения», - говорится в публикации BBC.

Предложенный роботом вариант можно было отредактировать или отправить как есть.

Никаких упоминаний о том, что основной контент был сгенерирован роботом, в письме не было.

Copilot также всего за 43 секунды подготовил многостраничную презентацию в PowerPoint на основе документа в Word. В качестве иллюстраций робот может использовать изображения в исходном документе или найти подходящие в собственной коллекции изображений (очищенных в плане копирайта).

Инструкцию сделать презентацию более яркой робот не понял.

Что же касается работы с Microsoft Teams, то здесь Copilot может не только суммировать сразу несколько тем, по которым производились высказывания, но и законспектировать слова одного конкретного пользователя, а также выделить главное в разгоревшемся споре, приведя основные аргументы обеих сторон.

На данный момент робот способен отличить спикеров только если они используют уникальные устройства каждый. Если за одним устройством - сразу два человека, то Copilot отличит, кто есть кто, лишь в том случае, если они называют друг друга вслух.

На вопрос к сотруднику Microsoft, не приведет ли использование этого робота к тому, что работники просто перестанут участвовать в подобных голосовых конференциях, тот отшутился, что тогда, вероятно, множество таких мероприятий превратятся в вебинары.

И что дальше?
Критики разработки уже говорят о том, что он сильно изменит ситуацию с офисной и административной работой, а кроме того, может вызвать излишнюю зависимость людей от себя.

«Что случится, если в инструменте произойдет сбой или его взломают? - задается вопросом Карисса Велиз (Carissa Veliz), доцент Института этики искусственного интеллекта при Оксфордском университете. «Это может стать кратковременным сбоем, а может - причиной новых ограничений, которые вам не понравятся. Ну, и что будет, если вы поймете, что уже настолько привыкли к системе, что не можете без нее обходиться вовсе? Что тогда?», - продолжает Карисса Велиз.

По мнению генерального директора компании «Информационные технологии будущего» Дмитрия Гвоздева, одной из сложнейших проблем с искусственным интеллектом, о которой ученые и фантасты говорят на протяжении десятилетий является возможная «замена» человека машиной. «И хотя есть большой соблазн сравнить нынешнее положение дел с любой из предыдущих промышленных революций (а напуганных такой перспективой - с членами, например, луддитского движения), ИИ делает отличия довольно существенными», - развивает мысль Дмитрий Гвоздев. Он считает, что на этот раз машина избавляет человека не столько от физической, сколько от интеллектуальной нагрузки, а человек устроен так, что без нагрузки его органы и конечности быстро деградируют и мозга это тоже касается. «Сейчас, конечно, удобнее думать, что речь идет только о рутинных, монотонных и не требующих серьезных умственных усилий задач. Но, если гипертрофировать ситуацию, легко представить, что даже некоторыми базовыми навыками в общении (к примеру) следующее поколение офисных работников обладать просто не будет», - подытожил Дмитрий Гвоздев.

Copilot станет доступен пользователям Microsoft 365 с 1 ноября. Ежемесячная плата за него составит 30 долларов.

Источник Для просмотра ссылки Войди или Зарегистрируйся
 

Искусственный интеллект может привести к гибели информации, заявил Пушков​


Искусственный интеллект может привести к гибели информации. Еще сложнее будет отличить фейки от правдивых и объективных материалов (объективные только из отдела пропаганды Кремля). Так считает глава Комиссии СФ по информационной политике и взаимодействию со СМИ Алексей Пушков.
 
TECNO представила Universal Toneтехнологию для корректной передачи оттенков и текстуры кожи при съёмке на смартфон

TECNO представила свою последнюю разработку в области мобильной съёмки — технологию TECNO Universal Tone, созданную для корректной передачи оттенков и текстуры кожи при съёмке на смартфон.

image_1.jpg

Источник изображения: TECNO

TECNO Universal Tone объединяет обновлённую базу спектральных и аналитических данных, позволяя отразить особенности различных национальностей, обеспечивая возможность создания портретных снимков в соответствии с индивидуальными ожиданиями пользователей по всему миру. Для усовершенствования технологии были привлечены ученые-колористы из различных университетов мира.

По словам Джека Гуо (Jack Guo), гендиректора TECNO, в технологии используется строгий научный подход, основанный на данных, для создания более точных и качественных изображений и обеспечения более естественного отображения красоты пользователей по всему миру.

TECNO Universal Tone использует алгоритмы на базе искусственного интеллекта:

Multi-Skin Tone Restoration Engine — ИИ-алгоритм визуализации тона кожи, основанный на диверсифицированной спектральной базе данных.
Local-Tuning Engine — алгоритм, предназначенный для настройки камер под различные сценарии, который анализирует окружающую среду, условия освещения, геоморфологические ландшафты и температуру, чтобы создать гармоничный кадр с учётом специфики региона.
AI-Powered Computational Portrait Engine — ИИ-алгоритм, который персонализирует изображение в соответствии с эстетическими элементами бьютификации, повышая точность определения тона кожи и оптимизируя его отображение, а также предлагая персонализированные улучшения портрета.
В процессе съёмки алгоритм Multi-Skin Tone Restoration Engine настраивает камеру для более точного и естественного отображения различных оттенков кожи, затем Local-Tuning Engine анализирует окружающую среду для восстановления теней с учётом региона и сценария и, наконец, AI-Powered Computational Portrait Engine применяет персонализированный алгоритм, соответствующий эстетическим и культурным предпочтениям разных стран.

Технология TECNO Universal Tone позволит подчеркнуть индивидуальность пользователей по всему миру, а также улучшить опыт при создании портретов.

Источник: Для просмотра ссылки Войди или Зарегистрируйся
 
NVIDIA наделит сотрудников сверхспособностями с помощью ИИ, который будет помогать в разработке чипов

Компания NVIDIA не только активно продвигает системы генеративного искусственного интеллекта среди клиентов, но и использует их для оптимизации собственных бизнес-процессов. Использующий накопленный разработчиками компании за 30 лет опыт ИИ-чат-бот помогает начинающим инженерам получать ответы на часто задаваемые вопросы, не отвлекая от работы более опытных коллег. Кроме того ИИ предложено использовать для генерации программного кода и работы с ошибками в чипах.

nvidia_01.jpg

Источник изображения: NVIDIA

О данной сфере применения ИИ на этой неделе рассказал ведущий научный сотрудник NVIDIA Билл Дэлли (Bill Dally). В опубликованной статье подробно рассказывается о том, как инженеры NVIDIA создали для внутреннего использования собственную большую языковую модель под названием ChipNeMo, обученную на внутренних данных компании для генерации и оптимизации программного обеспечения и помощи людям, занимающимся проектированием чипов.

Компания загрузила в языковую модель собственные архивы документации за 30 лет, связанные с разработкой полупроводниковых компонентов. Как пояснил научный руководитель NVIDIA, на практике опытные разработчики достаточно много времени уделяют ответам на вопрос своих младших коллег, и если эту функцию поручить искусственному интеллекту, то у наиболее ценных сотрудников высвободится больше времени на разработку чипов.

По словам представителя NVIDIA, такой чат-бот может добиться достаточно высокой эффективности при умеренных затратах на его развитие, если в систему будет подгружаться более узконаправленная информация, учитывающая предыдущий опыт компании. Разумный подход к расходованию системных ресурсов позволяет снизить затраты на реализацию соответствующих проектов. Чат-бот помогает инженерам искать необходимую документацию в архиве, не отвлекая своих коллег.

Ещё одна перспективная сфера применения генеративного искусственного интеллекта при разработке чипов NVIDIA — это написание фрагментов программного кода. ИИ-генератор кода уже разрабатывается, и его планируется интегрировать в существующие инструменты разработки чипов. Также ИИ способен помочь в документировании найденных дефектов в разработанных чипах. Система искусственного интеллекта будет достаточно быстро справляться с этой задачей и высвобождать ресурсы разработчиков для других операций.

«Наша задача заключается не в том, чтобы автоматизировать процесс или заменить людей, но наделить имеющихся у нас сотрудников сверхспособностями с целью повышения производительности их работы», — пояснил Билл Дэлли. А Марк Рен (Mark Ren), директор по исследованиям NVIDIA и ведущий автор статьи, отметил: «Я считаю, что со временем большие языковые модели помогут всем процессам [разработки чипов]».

На этом примере NVIDIA показала возможности применения экосистемы NeMo для оптимизации больших языковых моделей, используемых в полупроводниковой отрасли и других сферах промышленности. Клиенты и партнёры NVIDIA могут взять на вооружение данные средства, чтобы повысить эффективность собственных бизнес-процессов. Тонко настраиваемые специализированные языковые модели могут демонстрировать гораздо более высокую производительность, чем более ресурсоёмкие модели общего назначения.

Источник: Для просмотра ссылки Войди или Зарегистрируйся
 
Unity представила Muse — ИИ-инструменты, которые избавят разработчиков игр от рутины

Разработчики игрового движка Unity на сегодняшней конференции Unite Unite объявили, что их ИИ-платформа Muse стала официально доступна для общего использования в формате раннего доступа. Muse представляет собой пакет инструментов на базе ИИ, предназначенный для оптимизации процесса разработки игр и снижения количества «ручного» кодирования. Пакет был представлен ещё в июле 2023 года, а теперь стал доступен по подписке за $30 в месяц.

unity-muse.jpg

Источник изображения: Unity

Unity Muse описывается компанией как «постоянно расширяющийся набор функций на базе искусственного интеллекта» и предназначен для разработчиков всех уровней квалификации. Платформа позволяет генерировать программный код в процессе взаимодействия с чат-ботом. Бот также может прогнозировать и предлагать дальнейшие шаги разработки, поскольку располагает полным доступом к библиотеке ресурсов платформы.

В качестве примера можно упомянуть инструмент, специально разработанный для помощи начинающим дизайнерам Metroidvania при создании 2D-спрайтов. Он автоматически генерирует спрайты, соответствующие заранее заданным параметрам, и предлагает пользователю несколько вариантов на выбор.

Muse предлагает аналогичный процесс для создания спрайтов и текстур, применяемых как в 2D-, так и в 3D-проектах. Все эти инструменты обучены исключительно на данных и изображениях, которыми владеет или лицензирует Unity, поэтому разработчики не столкнутся с претензиями от правообладателей. Кроме того, Unity заявляет, что результаты Muse никогда не будут содержать «людей, логотипы или узнаваемые художественные стили».

Для просмотра ссылки Войди или Зарегистрируйся

По утверждению Unity, инструменты генерации спрайтов и текстур — это только начало. В ближайшие месяцы пакет Muse, среди прочего, будет дополнен механизмами ИИ для анимации персонажей и настройки поведения NPC. Подписчики Muse также получат доступ к платформе быстрого прототипирования и совместной работы под названием Sketch.

На конференции Unite Unite компания также подробно рассказала о будущем нейронном движке Sentis, который выходит далеко за рамки генерирования спрайтов и текстур, поскольку может решать сложные проблемы кодирования и даже создавать новые внутриигровые функции с нуля. Sentis в настоящее время находится на стадии открытого бета-тестирования и будет представлен публике в следующем году. Компания также анонсировала набор облачных инструментов для совместной работы и пообещала выпустить долгожданную шестую версию Unity в 2024 году.

Похоже, что скоро чат-боты и другие помощники на базе ИИ станут ключевыми инструментами разработки в арсенале гейм-дизайнера. Написание кода уходит в прошлое и, как не грустно, это становится главной тенденцией в отрасли. Не исключено, что скоро ИИ начнёт выпускать игры исключительно для других ИИ. ИИ станут играть в компьютерные блокбастеры, а мы вспомним лапту, городки и другие забавы на свежем воздухе.

Источник: Для просмотра ссылки Войди или Зарегистрируйся
 
Meta✴ представила ИИ-инструменты для создания и редактирования видео

Meta✴ представила два новых инструмента, в основу которых положены алгоритмы искусственного интеллекта — они позволяют генерировать и редактировать видеоролики по простому текстовому описанию. Впоследствии эти материалы могут публиковаться на принадлежащих компании платформах Instagram✴ или Facebook✴.

Emu_Video_01.jpg

Источник изображения: Meta✴

Первый инструмент получил название Emu Video — он генерирует видеоролики продолжительностью до четырёх секунд, основываясь на простом текстовом описании, фотографии, рисунке или сочетании этих исходных данных. Второй назвали Emu Edit, и он помогает пользователям так же по текстовому описанию редактировать уже имеющиеся видеоролики.

t75wahD8DRQsgKAa3y
Для просмотра ссылки Войди или Зарегистрируйся
Оба инструмента основаны на ИИ-модели Emu, первоначально предназначавшейся для генерации изображений по текстовому описанию. Нейросеть Emu также легла в основу некоторых функций генеративного ИИ, позволяющих редактировать изображения перед их публикацией в Instagram✴ — к примеру, они позволяют изменять визуальный стиль или фон фотографии.

С момента запуска службы ChatGPT большое число компаний начало активно внедрять продукты с использованием технологий генеративного ИИ. Наибольших успехов добились технологические гиганты в лице Amazon, Google, Microsoft и Meta✴. Гигант соцсетей начал активно развивать направление ИИ и внедрять функции на основе генеративных моделей.

Источник: Для просмотра ссылки Войди или Зарегистрируйся
 
DeepMind представила передовой ИИ для создания музыки и песен

Британская команда разработчиков утверждает, что ее модель способна генерировать высококачественный вокал, тексты песен и музыкальное сопровождение, имитирующее стиль исполнения популярных артистов. Экспериментировать с Lyria можно будет в рамках двух проектов, который запускают на YouTube. По мнению DeepMind, он станет «открытой игровой площадкой для творчества».

«Сегодня в партнерстве с YouTube мы анонсируем Lyria, самую передовую модель ИИ для генерации музыки, созданную Google DeepMind, и два эксперимента, формирующих новую площадку для творчества», — говорится в блоге компании. Эксперимент Dream Track «поможет углубить связь музыкантов с публикой», а Music AI tools предоставляет им набор инструментов для творчества.

DeepMind не раскрывает технических подробностей ИИ Lyria, разве что называет ее «самой передовой» музыкальной системой искусственного интеллекта. «Модель Lyria превосходно справляется с генерацией высококачественной музыки с аранжировкой и вокалом, выполняет задачи трансформации и продолжения, дает пользователям больше рычагов управления стилем и исполнением», — сказано в описании модели.
В эксперименте Dream Track сможет принять участие ограниченный круг пользователей, которым разрешат создать уникальные музыкальные композиции, выдержанные в стиле популярных исполнителей, давших свое согласие на использование своих песен для обучения модели Lyria. Участники эксперимента смогут записывать саундтреки длиной 30 секунд, которые потом будут выложены в виде коротких роликов в YouTube Shorts. Ниже — пара примеров.

Для просмотра ссылки Войди или Зарегистрируйся

Для просмотра ссылки Войди или Зарегистрируйся

Кроме того, выступая за ответственное использование технологий ИИ, DeepMind использует SynthID для нанесения «водяных знаков» на созданные Lyria музыкальные материалы. И призывает деятелей искусства и представителей музыкальной индустрии сформулировать стандарты ответственной разработки и распространения инструментов генерации музыки.

Lyria и другие музыкальные ИИ могут совершить революцию в музыкальной индустрии, утверждает Venture Beat. Вооружив исполнителей и композиторов передовыми инструментами, Google может демократизировать процесс производства музыки, сделав его более простым и доступным. Он же, вероятно, лишит заработка тысячи музыкантов. В любом случае, появление мощного ИИ на YouTube укрепит позиции Google в сфере передовых технологии для творчества.

Весной Google выпустила MusicLM — ИИ-инструмент, который превращает текстовые описания в музыку. Приложение позволяет пользователям вводить запрос, например «душевный джаз для званого обеда» или «гипнотический индустриальный техно-звук».

Источник Для просмотра ссылки Войди или Зарегистрируйся
 
Назад
Сверху