Cotygodniowy AI Newsletter vol. 18

Natywna edycja obrazów w GPT, Gemini i Grok | Najważniejsze wydarzenia w świecie AI i LLM | Nowe narzędzia w katalogu Ainsider

Spis treści

Natywna Edycja obrazów w ChatGPT, Gemini i Grok

W marcu 2025 roku ChatGPT, Google Gemini i Grok wprowadziły natywne funkcje generowania i edycji obrazów, rewolucjonizując sposób tworzenia wizualnych treści.

Oto porównanie edycji zdjęcia krakowskiego Wawelu w stylu Ghibli z generacjami ze wszystkich 3 platform.

Oto oryginalne zdjęcie

ChatGPT 4o (OpenAI Image Generator)

OpenAI zaktualizował model GPT-4o, dodając natywny generator obrazów o wysokiej rozdzielczości i zaawansowane funkcje edycji za pomocą tekstowych komend, np. zmiana stylu czy dodanie elementów. Popularność funkcji wzrosła dzięki obrazom w stylu Ghibli w mediach społecznościowych. Dostępna dla wszystkich użytkowników, lecz z ograniczeniami.

Gemini (Gemini 2.0 Flash)

Google rozszerzył Gemini 2.0 Flash o eksperymentalne generowanie i edytowanie obrazów w Google AI Studio. Model pozwala na wieloetapowe, kontekstowe modyfikacje obrazów za pomocą naturalnego języka, wykorzystując wiedzę i rozumowanie do tworzenia realistycznych wizualizacji, np. ilustracji kulinarnych. Dostępna dla deweloperów we wszystkich regionach obsługiwanych przez Google AI Studio: ai.dev 

Grok (xAI)

Grok od xAI zyskał natywne wsparcie dla generowania i edycji obrazów, umożliwiając użytkownikom tworzenie wysokiej jakości wizualizacji i modyfikowanie dostarczonych zdjęć za pomocą tekstowych komend. Funkcja dostępna na X w wybranych krajach od marca 2025, z planowanym pełnym wdrożeniem, oraz na Telegramie, oferując wszechstronność w stylach i kompozycjach.

Darmowe dla każdego użytkownika Grok z poziomu platformy X.

Subscribe to keep reading

This content is free, but you must be subscribed to Ainsider AI Newsletter to continue reading.

Already a subscriber?Sign In.Not now