«Добро пожадовать»: посмотрели, на что способны нейросети от Google

© Times.by
Еще пару лет назад казалось, что Google – неповоротливый гигант, который проспал ИИ-революцию, уступив пальму первенства дерзкому стартапу OpenAI. Но «спящий дракон» пробудился.
Google активно развивает свою экосистему искусственного интеллекта. Причем вкладывает в эту отрасль баснословные деньги. Только в 2025–2027 годах компания планирует потратить $25 млрд в центры обработки данных для ИИ.
Если раньше разработки искусственного интеллекта были скрыты внутри лабораторий, то теперь они доступны каждому пользователю и, что важно, глубоко интегрированы в привычные сервисы вроде Docs, Gmail, Фото или Поиска.
Редакция Times.by проверила, какие нейросети от «Корпорации добра» доступны уже сейчас, что они умеют и – самое главное – как они могут облегчить жизнь пользователю.
Gemini
Официальный сайт.
Gemini – это ответ Google на вопрос «Каким должен быть ИИ будущего?». Не просто чат-бот, а мультимодальная модель. Это значит, что Gemini изначально училась понимать не только текст, но и видео, аудио и изображения одновременно.
Gemini встроена в сервисы Google (Docs, Gmail, Drive). Она может найти нужное письмо или переписать резюме прямо в вашем документе.
Версия Gemini 3 Pro способна «держать в голове» огромные массивы данных. Вы можете загрузить в нее часовое видео или книгу в 500 страниц, и она ответит на любой вопрос по содержанию через несколько секунд.
Gemini всегда подключена к Google Поиску и оперирует свежими данными.
Представьте, что вы хотите спланировать ужин, но остались только странные ингредиенты в холодильнике. Вы можете просто сфотографировать то, что есть в холодильнике, и отправить фото в чат с запросом: «Посмотри на продукты на фото и предложи рецепт блюда для ужина с граммовками. Учитывай, что есть растительное, сливочное масло и стандартный для Беларуси набор специй».

© Максим Прохоренко, Times.by
На фото я вижу отличный набор продуктов: куриные голени, белокочанная капуста, репчатый лук, сырный соус, твердый сыр, перепелиные яйца и лепешки (тортильи).
Из этого набора можно приготовить полноценный и разнообразный ужин. Предлагаю приготовить сытную домашнюю шаурму.
Вот рецепт с примерными граммовками:
Домашняя шаурма (роллы) с курицей и капустой
Это идеальный вариант, чтобы использовать лепешки и сырный соус.
Ингредиенты (на 2 порции): • Куриные голени – 4 шт. (снять мясо с кости, выйдет примерно 300–350 г филе) • Лепешки (тортильи) – 2 шт. • Капуста – 150 г • Лук репчатый – 1/2 шт. • Сыр твердый – 50 г • Сырный соус – 2-3 ст. л. • Растительное масло – для жарки • Соль, перец – по вкусу
Приготовление: 1. Подготовка мяса: Срежьте мясо с голеней, нарежьте небольшими кусочками. Обжарьте на сковороде с маслом до золотистой корочки и готовности (около 10-12 минут). Посолите и поперчите. 2. Овощи: Капусту тонко нашинкуйте, немного помните руками, чтобы она стала мягче. Лук нарежьте тонкими полукольцами. 3. Сборка: Смажьте центр лепешки сырным соусом. Выложите слой капусты, затем обжаренную курицу и лук. 4. Сыр: Натрите твердый сыр на терке и посыпьте начинку сверху. 5. Финал: Сверните лепешку в плотный рулет (как шаурму). Обжарьте готовый ролл на сухой сковороде по 1–2 минуты с каждой стороны, чтобы лаваш стал хрустящим, а сыр внутри расплавился.
Удобно? Не то слово!
Точно так же нейронка поможет в работе, учебе и даст ответ на поставленный вопрос. Например, можно узнать краткое содержание книги или научной работы, чтобы оценить ее полезность для конкретного проекта.
Один минус – нужен VPN, причем США. Для переключения между инструментами нужно воспользоваться меню, хотя и через базовое диалоговое окно тоже можно. Только нужно четко сформулировать запрос: «создай видео» или «отредактируй фотографию».
Veo 3.1
Официальная страница.
Для создания нейровидео нужен все тот же Gemini, только переходим на вкладку Create videos (Veo 3.1). Первая попытка.
Промпт: Создай видео, каким ты видишь Минск в 2045 году. Особое внимание удели архитектурной композиции Раковского предместья, Немиги, площадям Победы и Якуба Коласа.
Получилось интересно. Результат для такого простого промта – достойный. Однако с кириллицей есть проблемы. Да и с озвучкой тоже не все ладно. Неправильно расставлены ударения, чего только стоит «Добро пожадовать»…
Попытка номер два. Пробую добавить деталей.
Промт: Живая картина Ван Гога «Звездная ночь». Звезды и завихрения в небе медленно вращаются, огни в домиках мерцают, кипарис слегка колышется на ветру. Стиль: точная имитация мазков масляной краски.
Результат разочаровал. Анимация статичнее, чем в автоматических коллажах «Google Фотографии», а знаменитые мазки Ван Гога искажены до неузнаваемости.
Пробую оживить фото. Видео, даже безобидные, такие как «братья пожимают друг другу руки и улыбаются» нейросеть делать отказывается – потому, что имеем дело с изображением детей. Увы, сюрприз для родного брата сделать не получилось.
Скриншот
А вот со взрослыми – пожалуйста.
Правда, результат так себе. Мужчина на себя не похож. Появилась несвойственная ему мимика. Несмотря на то что на фото и на видео – два разных человека, есть ощущение, что до полного совпадения осталось совсем чуть-чуть.
Что в итоге? Видео создаются эффектные и при должном манипулировании с промтами, даже корректные. Но есть и ложка дегтя – русский язык не поддерживается в должной мере. Да, есть кирилица, только на ней получается абракадабра. Да и озвучка не всегда корректная.
Imagen 3 и Nano-Banana
Официальная страница.
Google долго не выпускал свой генератор картинок в широкий доступ, опасаясь скандалов. Но Imagen 3 изменил правила игры. Это одна из самых фотореалистичных моделей на рынке, которая наконец-то научилась писать текст на изображениях без ошибок (ахиллесова пята ранних нейросетей).
Изображения людей и текстур (еда, ткани) выглядят настоящими.
Nano-Banana хоть и способна создавать изображения, причем неплохо, все же больше подходит для редактирования. В считанные секунды может поменять элементы на картинке (например, заменить кошку на собаку, не перерисовывая весь фон). При этом умеет сохранять лицо и стиль персонажа на разных изображениях, создаст диаграмму или инфографику на лету.
Если попросить нарисовать вывеску с надписью «Кафе и печеньки», нейросеть напишет именно это, а не набор инопланетных символов.
Задаем промпт: «Сгенерируй фотореалистичное изображение фасада уютной кофейни в Минске в стиле киберпанк. Неоновая вывеска с надписью «Кафе и печеньки». Идет дождь, отражения в лужах».
А вот и результат.

© Nano-Banana Generated
NotebookLM
Официальная страница.
Пожалуй, самый недооцененный и впечатляющий инструмент Google на данный момент – NotebookLM. ИИ-блокнот, который работает строго с теми документами, которые вы в него загрузили. Никаких выдумок (галлюцинаций) на основе случайных данных из интернета.
Главная «фишка» – Audio Overviews. Google добавил функцию, которая взорвала соцсети. Вы загружаете сложную научную статью или PDF-учебник, нажимаете одну кнопку, и нейросеть генерирует подкаст, где двое ведущих (мужчина и женщина) живым языком, с шутками и перебиваниями, обсуждают ваш документ.
Можно, например, загрузить лекции за весь семестр и попросить: «Сделай шпаргалку по ключевым датам» или «Сгенерируй подкаст, чтобы я послушал его по дороге в университет».
А тем, кто имеет с большими объемами данных, можно загрузить 10 отчетов конкурентов и спросить: «В чем главные различия их стратегий?».
Для каждой задачи свой инструмент
Экосистема Google сейчас напоминает конструктор Lego.
Нужен универсальный помощник для текстов, кода и планирования? Идите в Gemini.
Нужно разобраться в горе документов или подготовиться к экзамену? NotebookLM – ваш лучший друг.
Нужны картинки для презентации? Imagen 3 сделает это красиво.
Google перестал догонять. Он начал предлагать инструменты, которые встраиваются в жизнь так, что скоро перестанем замечать, где заканчивается наш интеллект и начинается искусственный.

