Внедрение технологий ИИ в жизнь (программы, устройства, услуги)

XUC

второе пришествие
Регистрация
3 Сен 2006
Сообщения
869
Реакции
569
ветка новостей про ИИ - электронные внедряемые устройства вынесена в отдельную тему https://nulled-mirror.com/threads/ii-ehlektronnye-ustrojstva.313550/#post-3002156
--------------------------------редакция шапки 03.12.23----------------------------------------
=========================================================================
Google Pixel 8 смогут силами ИИ менять лица людей на фото, убирать размытость, двигать объекты и не только

Компания Google сегодня представила новые функции на базе искусственного интеллекта Magic Editor и Best Take, призванные расширить возможности редактирования фотографий на новых смартфонах серии Pixel 8. Также появится функция Zoom Enhance для улучшения масштабирования фото и другие новые ИИ-функции.

pixel_8_01.jpg

Источник изображений: Google

С помощью Magic Editor пользователи могут перемещать объекты на фото, изменять их размер, удалять ненужные элементы или, например, заменить пасмурное небо солнечным. Функция также позволяет менять фоны на фотографиях при помощи несколько заранее заготовленных пресетов. Magic Editor будет самостоятельно предлагать контекстуальные изменения на фото с учётом освещения и фона при которых были сделаны снимки. Функция подготовит несколько вариантов отредактированных фотографий, предложив выбрать нужный. Впервые Magic Editor была анонсирована на конференции Google I/O в мае.

ezgif-4-016d87c1b3.gif

Magic Editor

Компания Google отмечает, что Magic Editor находится «на ранней стадии разработки», поэтому полученные результаты редактирования фотографий могут не всегда удовлетворять потребности пользователя.

Функция Best Take в свою очередь комбинирует множество групповых фотографий, позволяя создавать наиболее удачный снимок, на котором люди не моргают или не смотрят в камеру. Функция позволяет заменить лица людей на снимке их же лицами с других, более удачных фотографий.

Best-take.gif

Best Take

Best Take может работать как в автоматическом, так и ручном режиме. Во втором случае позволяется самостоятельно подбирать нужные эмоции на лицах тех или иных людей на фото, а затем объединять все результаты на конечном снимке.

Функции Both Best Take и Magic Editor станут доступны на смартфонах серии Pixel 8 с 12 октября. Вероятно, в будущем эти функции появятся и на других смартфонах на базе Android.

Новые смартфоны Pixel 8 также предложат такие функции редактирования, как Magic Eraser и Photo Unblur. Первая позволяет удалять со снимка нежелательные детали и объекты. Вторая предназначена для исправления размытости изображений. В Google отмечают, что смартфон Pixel 8 Pro получит продвинутую версию Magic Eraser, которая позволит удалять с фото более крупные объекты.

Zoom-enhance-Pixel.gif

Zoom Enchance

Позже в этом году у смартфонов Pixel 8 Pro также появится функция Zoom Enhance, которая посредством генеративного ИИ улучшает качество фотографий и снижает расстояние между пикселями при фотографировании с увеличением, чтобы на фото присутствовало меньше шума.

Источник: Для просмотра ссылки Войди или Зарегистрируйся
 
Последнее редактирование:
В Android 14 появился ИИ-генератор обоев

Сегодня состоялась презентация смартфонов Pixel 8 и Pixel 8 Pro, а также других аппаратных и программных новинок компании Google. Вместе с этим состоялся релиз мобильной операционной системы Android 14, которая имеет немало новых функций, включая генератор обоев на базе нейросети.

205.jpg

Источник изображения: Google

Впервые эта функция была анонсирована в рамках мероприятия Google I/O в мае этого года. Взаимодействие с генератором обоев начинается с выбора категории, например, классического искусства, после чего нужно задать требуемые параметры и алгоритм представит несколько вариантов изображений на их основе. В одном из примеров Google выбирается категория Dreamscape, после чего отмечаются варианты структуры, материала и цвета. В конечном итоге формируется запрос «Дом из растений цвета индиго», после обработки которого алгоритм выдаёт несколько изображений покрытых растениями построек с входной дверью и фиолетовым оттенком.

Первыми функцию генерации обоев смогут испытать в деле обладатели смартфонов Pixel 8 и Pixel 8 Pro. Когда она может появиться на других смартфонах с Android 14, не уточняется. Однако формулировка Google предполагает, что в конечном счёте это всё же произойдёт.

ИИ-генератор обоев — это лишь одна из многих новых функций Android 14. Программная платформа предоставит широкие возможности в плане настройки пользовательского интерфейса, включая экран блокировки, возможность выбора разных шрифтов и цветов, ситуативные виджеты и др. Хотя Android в целом опережает iOS в плане возможностей визуальной настройки, пользователям не всегда легко привести интерфейс к желаемому виду. С выходом Android 14 сделать это будет проще.

Источник: Для просмотра ссылки Войди или Зарегистрируйся
 
Google Pixel Fold принёс субтитры в реальное общение с новым режимом двухэкранного переводчика

Периодически разработчики создают новые функции программного обеспечения, которые делают тот или иной аппаратный формфактор значительно более полезным. Одной из таких функций может стать режим двухэкранного переводчика, который в скором времени станет доступен владельцам складных смартфонов Google Pixel Fold.

204.jpg

Источник изображения: Google

Полностью раскрыв смартфон, пользователь может говорить с кем-то, кто говорит на другом языке, при этом переводы фраз каждого из собеседников будут отображаться по обе стороны. Таким образом, собеседник будет видеть, что вы говорите на его языке, и наоборот. Такие вот синхронные субтитры в реальной жизни. В настоящее время система доступна на 45 языках.

Напомним, выпущенный в середине того года смартфон Pixel Fold является первым устройством Google с гибким дисплеем. Аппарат оснащён 7,6-дюймовым основным дисплеем и 5,8-дюймовым внешним экраном. Его аппаратной основой стал фирменный микропроцессор Google Tensor 2, аналогичный тому, что использовался в Pixel 7 и Pixel 7 Pro. В конструкции задействован прочный шарнирный механизм, способный выдержать 200 тыс. складываний. Что касается цены, то приобрести Pixel Fold можно за $1800.

Источник: Для просмотра ссылки Войди или Зарегистрируйся
 
ИИ-генератор изображений DALL-E 3 появился в Bing, но опробовать его трудно из-за ажиотажа

Всем пользователям служб Bing Chat и Bing Image Creator стала доступна новейшая модель искусственного интеллекта — генератор изображений OpenAI DALL-E 3. На прошлой неделе система была развёрнута для пользователей Bing Enterprise, затем к ним присоединились пользователи Bing Image Creator, а теперь она открыта для всех.

dall-e-3.jpg

Источник изображения: blogs.bing.com

Таким образом, поисковая машина Bing получила доступ к DALL-E 3 даже раньше, чем OpenAI ChatGPT — это должно случиться до конца месяца, но только для пользователей, оформивших платную подписку. Система лучше понимает команды, а также генерирует более креативные и фотореалистичные изображения. Кроме того, она спроектирована так, чтобы её было проще использовать: DALL-E 3 интегрировали в Bing Chat и ChatGPT, а не стали делать отдельным продуктом. Пользователи могут постепенно совершенствовать изображение с чат-ботом, а не бесконечно упражняться в составлении запросов.

К сожалению, на текущий момент пользоваться DALL-E 3 через Bing довольно затруднительно: генератор изображений вызвал большой ажиотаж, и сейчас его серверы перегружены, а служба сообщает о «невозможности обрабатывать новые запросы». Это подтвердил и сотрудник Microsoft Михаил Парахин: «Мы ожидали большого интереса, но не ожидали, что он будет настолько большим».

Одной из ключевых особенностей генератора изображений в новом интерфейсе является его способность не только создавать картинки, но и предлагать варианты дальнейших действий. К примеру, в диалоге появляются шаблоны вроде «Можешь добавить радугу на заднем плане?», «Сделай его кошкой вместо собаки» или «Добавь птиц вокруг водопада».

Источник: Для просмотра ссылки Войди или Зарегистрируйся
 
ИИ-генератор стикеров заработал в Instagram и Facebook, и пользователи тут же заставили его создавать непристойности

В Instagram✴ и Facebook✴ Messenger появилась возможность генерировать стикеры по текстовым запросам с помощью ИИ. Некоторые пользователи, получившие доступ к новому инструменту компании Meta, уже начали экспериментировать с ним, в результате чего появилось множество забавных, но сомнительных творений.

luigi-rifle.jpg

Источник изображения: twitter.com/Pioldes

Пользователь соцсети X под ником Pioldes, у которого ИИ-генератор стикеров появился в приложении Facebook Messenger, попытался совместить несовместимое, и его творения оказались подчас непристойными: это вооружённый сантехник Луиджи, брат того самого Марио; дети-солдаты; Микки Маус в уборной; крайне сомнительные воплощения канадского премьер-министра Джастина Трюдо (Justin Trudeau), Карла Маркса и ёжика Соника; и даже женщина, которая кормит грудью покемона Пикачу.

Meta представила работающий на основе алгоритмов ИИ генератор стикеров на прошлой неделе. Изображения создаются большой языковой моделью Llama 2 — она, как заявил разработчик, позволяет выдавать десятки качественных стикеров за считанные секунды. Инструмент будет доступен в личных сообщениях и в разделе Stories в Facebook и Instagram, а также в Facebook Messenger и WhatsApp. Пока пользоваться им может лишь ограниченная англоязычная аудитория.

В компании не уточнили круг пользователей, которые получили доступ к генератору стикеров. Но уже удалось установить, что некоторые слова в описаниях заблокированы: при попытке их ввести в поле описания стикеров выводится предупреждение, что данная лексика нарушает правила сообщества Meta. Выяснилось также, что генерировать неприемлемый контент можно, используя запрещённые слова с опечатками или подменяя их описаниями.

Такого рода сбои характерны при запуске ИИ-инструментов, поэтому в Meta, видимо, и решили на начальном этапе ограничить доступ к генератору стикеров. Отладив его на этих ошибках, компания сможет выпустить общедоступную версию.

Источник: Для просмотра ссылки Войди или Зарегистрируйся
 
Браузер Arc обзавёлся функциями ИИ, но не такими, как у всех и только на 30 дней

Компания под названием The Browser Company, ответственная за разработку браузера Arc, рассказала о внедрении в него функций искусственного интеллекта. Разработчики принципиально отказались делать это по образцу других проектов, в которых ограничиваются преимущественно кнопкой ChatGPT на боковой панели или чем-то аналогичным.

arc_1.jpg

Источник изображений: The Browser Company

В The Browser Company решили придерживаться иного подхода с учётом того, что ресурсов на разработку собственной большой языковой модели у них нет. Поэтому разработчики начали экспериментировать, создавая один прототип за другим, пока их не оказалось более двух десятков. После этого были отобраны пять ключевых функций, получивших общее название Arc Max — работают они на платформах GPT-3.5 и Anthropic. Ниже приводится список этих функций.

«Спроси ChatGPT» (Tidy Tab Titles). Пожалуй, наиболее очевидная и наименее интересная функция, которая предусматривает возможность задать ChatGPT вопрос прямо из командной строки Arc.
«Аккуратные заголовки вкладок» (Tidy Tab Titles). Когда пользователь закрепляет вкладку в Arc, браузер автоматически её переименовывает, основываясь на содержимом, чтобы вкладку было проще найти на боковой панели.
«Аккуратные загрузки» (Tidy Downloads). Аналогичная функция, только для загрузок. Вместо вывода зачастую бессмысленных имён файлов браузер переименовывает их таким образом, чтобы они соответствовали содержимому.
«Пятисекундный предварительный просмотр» (Five-Second Previews). Функция позволяет навести указатель мыши на ссылку и нажать клавишу Shift, чтобы получить краткое описание содержимого страницы по этой ссылке.
«Спроси о странице» (Ask on Page). Если пользователю не удаётся найти на странице интересующее его содержимое по полному совпадению, можно задать ИИ вопрос, ограничившись контекстом только этой страницы.

arc_2.jpg


The Browser Company рассказала и о других прототипах, которые впоследствии были отвергнуты. Один из прототипов, например, представлял собой браузер, работающий только на ИИ: при запросе «Поездка в Италию на поезде» он составлял полный план поездки, включая советы путешественникам, ссылки на достопримечательности, задавал дополнительные вопросы и решал множество прочих задач. Но функция оказалась менее полезной, когда речь не шла о путешествиях. Не сработала и идея с кнопкой «Спросить», которая возникала в нижней части каждой открытой страницы — нечто подобное есть и в других браузерах, да и функция, как выяснилось, быстро утомляет.

Была отвергнута идея с упорядочиванием заметок, а также автоматическим составлением списков покупок на основе открытых вкладок — это любопытно, но едва ли функции оказались бы популярными. Крайне перспективной казалось развитие кнопки «Вперёд», по нажатии на которую ИИ рекомендовал бы новые страницы на основе истории просмотра. Проблема оказалась в принципиально неверном подходе: данная функция увеличила бы время пребывания пользователя в интернете, а задача разработчиков браузера, напротив, в том, чтобы его сократить. Наконец, пришлось отказаться и от упорядочивания вкладок при помощи ИИ — функция действительно полезная, но работала она слишком медленно.

Выбранные разработчиками пять функций Arc Max будут присутствовать в браузере только ближайшие 30 дней, а его пользователям предложено проголосовать за то, какие из них оставить. В The Browser Company отметили, что выбор в пользу той или иной из них является вопросом конфиденциальности, поскольку их работа предполагает отправку тех или иных данных разработчикам моделей ИИ. Единого мнения об их дальнейшей судьбе нет даже у сотрудников самой компании.

Источник: Для просмотра ссылки Войди или Зарегистрируйся
 
Google объявила интеграцию «Ассистента» и ИИ-бота Bardголосовой помощник выйдет на новый уровень

В рамках сегодняшнего мероприятия Made by Google были объявлены планы по интеграции ИИ-чат-бота Bard в состав голосового помощника Google Ассистент». По словам компании, сочетание «генеративного мышления» чат-бота Bard с «персонализированной помощью» «Ассистента» позволит давать более контекстно-ориентированные ответы на запросы пользователей. Усовершенствованного цифрового помощника собираются выпустить в течение ближайших месяцев.

70bab6d0-62c8.jpg

Источник изображений: Google

«Хотя голосовой помощник "Google Ассистент" отлично справляется с быстрыми задачами, такими как установка таймеров, показ прогноза погоды, а также с быстрыми звонками, мы всегда считали, что личный цифровой помощник с продвинутыми возможностями должен уметь делать гораздо больше. Однако технологий, которые позволили бы это реализовать, до этого не существовало», — заявила в рамках своего доклада на мероприятии Made by Google вице-президент отдела разработки голосового помощника «Ассистент» и чат-бота Bard Сисси Сяо (Sissie Hsiao).

e231b359e47e.jpg


Аналогично недавно обновлённому голосовому помощнику Alexa от компании Amazon новый голосовой помощник Google с чат-ботом Bard сможет давать более персонализированные ответы на запросы пользователей. Например, он сможет помогать в планировании поездок, с поиском и сортировкой электронной почты, созданием списка покупок, а также с отправкой сообщений. Взаимодействовать с ним можно будет посредством текста, голосовых команд или изображений, при этом более непринуждённо и с учётом более контекстуально-насыщенных запросов по сравнению с актуальной версией «Google Ассистента».

В рамках анонса обновлённого Google Assistant с чат-ботом Bard представитель компании в качестве примера описала следующую ситуацию: «Представьте, что вы компанией отправились на прогулку с собакой и дошли до развилки на дороге. Сделайте фотографию указателя рядом с развилкой и спросите голосового помощника: какой путь ты порекомендуешь группе людей с маленькой собакой? Помощник, сможет предложить, например, северное направление на развилке, посчитав его наиболее оптимальным в такой ситуации».

Google отмечает, что новая функция находится на ранней стадии разработки и скоро будет предоставлена для закрытого тестирования. Первыми обновлённый ассистент получат владельцы смартфонов Pixel 8 и Pixel 8 Pro. В перспективе она появится на всех Android-устройствах, а также на iOS.

Источник Для просмотра ссылки Войди или Зарегистрируйся
 
«Яндекс Браузер» научился кратко пересказывать видео
Теперь можно быстро узнать содержание и сразу перемотать на нужный фрагмент


Пользователи «Яндекс Браузера» и «Яндекс Поиска» теперь смогут прочитать пересказы русскоязычных видео. По мнению разработчиков, новая функция позволит пользователям быстро ознакомиться с содержанием ролика, а авторам контента привлечь больше зрителей. Используя таймкод в пересказе видео, можно сразу перейти к интересующему фрагменту. Например, в обзоре нового смартфона сразу перемотать на характеристики камеры. Кроме того, функция пригодится, если нужно быстро узнать содержание длинного видео.

yapereskaz_large.jpg


Пересказ видео работает на базе нейросети YandexGPT, она обобщает русскоязычные ролики длиной от двух минут до четырёх часов и пересказывает те фрагменты, где есть речь. Сначала алгоритм превращает аудиодорожку в текст с помощью распознавания речи, а затем разбивает его на смысловые фрагменты, обобщает каждый из них и указывает таймкод начала каждого блока.

Краткий пересказ также доступен в «Поиске» Яндекса в любом браузере. Сейчас функция работает для популярных роликов — например, для рецептов приготовления блюд, хендмейда, видео с решением школьных заданий или записей телепередач. Кроме того, можно получить текстовую выжимку из YouTube-роликов, загрузив ссылку на клип на сервис 300.ya.ru. Чтобы получить пересказ ролика, нужно открыть видео и нажать на кнопку «Краткий пересказ».

Источник Для просмотра ссылки Войди или Зарегистрируйся
 
В Германии изобрели миниатюрный спектрограф с ИИ, который может определять состав текстиля

Исследователи из Института фотонных микросистем Фраунгофера разработали миниатюрный спектрограф, способный анализировать текстильные ткани и определять их состав.

fraunhofer.jpg

Источник изображения: fraunhofer.de

Сканер работает в ближнем инфракрасном диапазоне и анализирует свет, который отражается от волокон ткани — устройство раскладывает его на диапазоны в длинах волн от 950 до 1900 нм, конвертирует результат в электрические сигналы, которые затем при помощи алгоритмов искусственного интеллекта обрабатывает анализатор. Сравнивая результаты с подготовленной базой данных, ИИ-платформа быстро выдаёт ответ, из каких материалов состоит изучаемый фрагмент ткани.

Оптическое разрешение составляет 10 нм — это значит, что спектрометру под силу идентификация смешанных тканей, например, сочетаний полиэстера и хлопка, пояснил один из авторов изобретения Генрих Грюгер (Heinrich Grüger). Сканер представляет собой устройство со стороной 10 мм и толщиной 6,5 мм. По мнению разработчиков, оно поможет текстильным предприятиям в сортировке материалов для их более эффективной обработки.

Связав такой сканер с камерой мобильного телефона, потребитель получил бы возможность на месте определять, соответствуют ли заявления производителей текстиля действительности. Кроме того, анализатор помог бы выбрать необходимую программу стирки для старой вещи, у которой утеряны бирки. Исследователи говорят, что вместе с цифровыми камерами будут развиваться и спектрометры: характеристики камеры, которая 10 лет назад стоила €500, уступает возможностям модулей на современных телефонах.

Источник: Для просмотра ссылки Войди или Зарегистрируйся
 
ИИ-помощник Copilot в Windows 11 начал показывать рекламу

В конце прошлого месяца Microsoft выпустила функциональное обновление для операционной системы Windows 11. Одной из главных особенностей пакета стал ИИ-помощник Copilot, который построен на базе нейросети и в будущем станет доступен всем пользователям платформы. Теперь же пользователи, которые уже получили доступ к новому инструменту, стали видеть в результатах запросов стороннюю рекламу.

1053.jpg

Источник изображения: Microsoft

Если раньше Microsoft встраивала в Windows рекламу собственных продуктов, то теперь речь идёт об объявлениях на основе пользовательских запросов. Например, если попросить Copilot дать рекомендации по выбору процессорного кулера, то ИИ-помощник выдаст результаты поиска материалов по популярным тематическим сайтам в Bing вместе с партнёрскими ссылками на продукты, подобранные по ключевым словам запроса.

В ходе тестирования Copilot один из пользователей указал в запросе следующее: «Какой кулер для процессора считается хорошим?». В ответе Copilot указал модели от Noctua, Corsair и Cooler Master. При этом в блоке ниже появилось несколько рекламных объявлений, продвигающих продукты от DeepCool, Thermalight, MSI и др. Другими словами, характер демонстрируемых объявлений зависит от пользовательского запроса.

1054.jpg

Источник изображения: extremetech.com

В целом, этот шаг Microsoft не является чем-то удивительным, поскольку в прошлом софтверный гигант уже пытался демонстрировать рекламу в проводнике, меню настроек и даже на экране входа в систему. Отличие заключается в том, что прежде всегда речь шла о рекламе продуктов Microsoft, а не объявлениях сторонних компаний. Несмотря на наличие рекламы, текстовая часть в ответах Copilot формируется корректно и представляет собой полезную информацию, которую алгоритм собирает с популярных сайтов соответствующей тематики.

Также отмечается, что Copilot требует непрерывного доступа в интернет даже для выполнения локальных задач, таких как активация тёмной темы Windows. Вероятно, это связано с желанием Microsoft знать, как именно люди используют ИИ-алгоритм компании, чтобы развивать его в дальнейшем. Тем не менее, необходимость в постоянном интернет-подключении выглядит странно, когда речь идёт о выполнении задач на локальном компьютере.

Источник: Для просмотра ссылки Войди или Зарегистрируйся
 
Назад
Сверху