
Google prowadzi Google Nano Banana, narzędzie do generowania i edycji obrazów oparte na sztucznej inteligencji, wykraczające poza aplikację Gemini. Firma rozpoczęła integrację z wyszukiwarką Google za pośrednictwem Lens i NotebookLM, a także potwierdziła, że wkrótce pojawi się ono w Zdjęciach Google.
Bazując na modelu Gemini 2.5 Flash Image, ta sztuczna inteligencja przekształca instrukcje tekstowe w wizualne rezultaty, zachowując spójność charakteru i stylu. Według firmy, użytkownicy już wygenerowali ponad 5.000 miliardów obrazów, wprowadzając ją na rynek produktów, z których wiele osób korzysta codziennie, początkowo w Stanach Zjednoczonych, z planowanym rozszerzeniem na inne języki i regiony.
Czym jest Nano Banana i jak działa?
W istocie Nano Banana interpretuje podpowiedzi w języku naturalnym Aby tworzyć obrazy od podstaw lub wprowadzać precyzyjne zmiany do zdjęcia. Możesz zmieniać tła, dostosowywać kolory, usuwać obiekty lub osoby, przywracać stare zdjęcia, oddalać, modyfikować wyrazy twarzy i łączyć wiele ujęć w jedną spójną scenę.
Jednym z jego kluczy jest spójność wizualna: Zachowuje rysy twarzy i układ obiektów w wielu edycjach, co jest szczególnie przydatne do zachowania postaci lub stylu w wielu wariantach. Im bardziej szczegółowe żądanie, tym wierniejszy rezultat.
Aby wzmocnić możliwość śledzenia, Google dodaje SynthID (widoczny znak wodny i sygnał cyfrowy w metadanych) w generowanych lub edytowanych obrazach, co pomaga w identyfikacji treści wytworzonych przy użyciu tej technologii bez wpływu na jej postrzeganą jakość.
Wyszukiwarka i Google Lens: Twórz i edytuj na swoim urządzeniu mobilnym
W aplikacji Google Lens debiutuje Tryb „Utwórz”Następnie możesz zrobić zdjęcie lub wybrać je z galerii i wpisać instrukcje, aby sztuczna inteligencja natychmiast zastosowała zmiany. Na niektórych urządzeniach obok opcji wyszukiwania i tłumaczenia pojawia się przycisk „Nano Banana Create”, umożliwiający szybki dostęp do tych funkcji.
Przewodniki po doświadczeniach z przykładami tego typu "Zrób ze mnie marionetkę" lub „Postaw mnie na ulicy w Europie” i umożliwia przełączanie między przednim a tylnym aparatem przed wysłaniem komunikatu. Po zrobieniu zdjęcia, obraz jest dodawany do pola tekstowego trybu AI, aby opisać transformację, którą chcesz zobaczyć.
Praktyczny przykład: jeśli ktoś chce przymierzyć dodatek bez fizycznego zakładania go, wystarczy zrób zdjęcie obiektu i kolejny z artykułu: sztuczna inteligencja może połączyć oba i pokazać, jak to będzie wyglądać. Cały proces pracy jest skoncentrowany w Lens, więc nie ma potrzeby opuszczania przeglądarki w celu wykonania szybkich zadań edycyjnych.
Ta integracja jest aktywowana jako pierwsza po angielskuzarówno na Androidzie, jak i iOS, a Google zapowiada, że usługa będzie stopniowo rozszerzana na inne rynki i języki.
NotebookLM: Style wideo i podsumowania ze wsparciem wizualnym
W NotebookLM Nano Banana działa w tle, aby wzbogacić Przeglądy wideo z obrazami generowanymi kontekstowo ze źródeł dodanych przez użytkowników. Narzędzie zawiera sześć stylów kreatywnych i umożliwia dostosowanie formatu wideo.
- style:akwarele, anime, papierowe wzory, tablica suchościeralna, wydruki retro i dziedzictwo.
- Formaty: bardziej szczegółowy film („Wyjaśniający”) i krótszy („Krótki”).
Celem jest, aby wyjaśnienia wizualne były bardziej użyteczne i odpowiednie do kontekstu, z ilustracjami, które nie ograniczają się do ogólnych zdjęć stockowych, lecz odzwierciedlają rzeczywistą treść dokumentów przesłanych na platformę.
Zdjęcia Google: Co nadchodzi
Google ogłosiło, że dotrze w Zdjęciach w nadchodzących tygodniach. Chociaż nie podano szczegółów, idea jest taka, że użytkownicy będą mogli edytować i ulepszać swoje zdjęcia bezpośrednio z biblioteki, łączyć zdjęcia lub poprawiać portrety bez opuszczania aplikacji.
Cena, plany i dostępność
Dla ogółu społeczeństwa Nano Banana może być stosowany bezpłatnie z aplikacji Gemini Na urządzeniach mobilnych i w internecie. Wystarczy przesłać zdjęcie i wprowadzić żądane instrukcje, aby szybko wygenerować lub edytować treść.
W przypadku użytku profesjonalnego dostęp jest zapewniany za pośrednictwem Google AI Studio i Vertex AI z rozliczeniem za użytkowanie: milion tokenów 30 USD (cena, którą Google szacuje na około 0,039 EUR za wygenerowany obraz, według przykładowych kosztów). Niektóre plany, takie jak Google AI Pro, obejmują wysokie dzienne limity edycji.
Rozszerzona dostępność rozpoczęła się w Stanach Zjednoczonych, a firma twierdzi, że wdrożenie obejmie również więcej krajów i językówW międzyczasie tryb Create aplikacji Lens będzie stopniowo wzbogacany o nowe funkcje i ulepszenia.
Zastosowania praktyczne, ograniczenia i bezpieczeństwo
Oprócz tworzenia od podstaw, sztuczna inteligencja wyróżnia się w wydania złożone takich jak odnawianie starych zdjęć, zmiana atmosfery sceny czy zachowanie tożsamości osoby po wielokrotnych transformacjach. Możesz również łączyć obrazy i dostosowywać oświetlenie i perspektywę, aby uzyskać spójny efekt.
Jak w przypadku każdej generatywnej sztucznej inteligencji, może istnieć błędne interpretacje monitów lub niedoskonałych wyników. Dokładność poprawia się dzięki szczegółowym instrukcjom i kolejnym iteracjom; system zapamiętuje stan obrazu, aby wprowadzać zmiany w kolejności. Zastosowanie SynthID i ulepszonych metadanych ma na celu ograniczenie ryzyka niewłaściwego użycia i ułatwienie identyfikacji wygenerowanych treści.
Połączenie edycji z wykorzystaniem tekstu, bezpośredniej integracji z popularnymi produktami i możliwości śledzenia sprawia, że Nano Banana jest ważnym elementem ekosystemu Google. Dzięki wyszukiwarce, Lens, NotebookLM i jego przyszłemu wprowadzeniu do aplikacji Zdjęcia granica między przechwytywaniem a tworzeniem staje się krótsza, a przepływ pracy dla… generuj niezawodne i szybkie obrazy jest w zasięgu każdego.
