Cotygodniowy AI Newsletter vol. 17

Najważniejsze wydarzenia w świecie AI i LLM z ostatniego tygodnia | Porównanie pięciu najpopularniejszych LLM | Nowe narzędzia AI w katalogu Ainsider

W tym wydaniu:

Najważniejsze wydarzenia w świecie AI i LLM w ostatnim tygodniu

1. Mistral Small 3.1

Mistral AI wypuściło Mistral Small 3.1, otwarty model o 24 miliardach parametrów, który przewyższa konkurentów, takich jak Gemma 3 od Google i GPT-4o Mini od OpenAI, w kluczowych testach. Model obsługuje multimodalne dane wejściowe, radzi sobie z kontekstem do 128 000 tokenów i przetwarza 150 tokenów na sekundę, co czyni go wysoce wydajnym. To może przyspieszyć rozwój aplikacji AI, szczególnie w sektorze open-source.
Oficjalne ogłoszenie Mistral AI

2. Claude Web Search

Anthropic zintegrowało funkcję wyszukiwania internetowego w modelu Claude, umożliwiając pobieranie aktualnych informacji z sieci. Każda odpowiedź zawiera cytaty inline, co ułatwia weryfikację źródeł. To rozszerzenie może poprawić dokładność i użyteczność Claude w zadaniach badawczych.
X post Anthropic

3. Modele audio OpenAI

OpenAI wprowadziło trzy nowe modele audio: gpt-4o-mini-tts (tekst-na-mowę) oraz gpt-4o-transcribe i gpt-4o-mini-transcribe (mowa-na-tekst), które przewyższają model Whisper pod względem wydajności. Są dostępne przez API, co może usprawnić aplikacje głosowe, takie jak asystenci czy transkrypcje.
Ogłoszenie OpenAI

4. Trening wideo Krea AI

Krea AI uruchomiło funkcję treningu wideo dla modelu Wan 2.1, pozwalającą użytkownikom trenować AI za pomocą własnych filmów i obrazów do generowania spersonalizowanych treści wideo. To otwiera nowe możliwości dla twórców, umożliwiając dostosowanie stylów i ruchów.
X post Krea AI

5. Mapy myśli - mind maps w NotebookLM

NotebookLM od Google dodało funkcję map myśli, zasilaną przez Gemini Pro, pomagającą wizualizować i organizować złożone informacje. To wzmacnia rolę NotebookLM jako asystenta badawczego opartego na AI, szczególnie przydatnego w analizie danych.
X post Simon @tokumin

6. Hunyuan 3D Generation AI

Tencent zaktualizowało model generowania 3D Hunyuan, wprowadzając dwie wersje: 3D 2.0 MV (Multi-View Generation) i 3D 2.0 Mini dla szybszego generowania. To może przyspieszyć rozwój aplikacji 3D, takich jak gry czy wizualizacje.
X post Hunyuan

7. Nowa wirtualna kamera Stability AI

Stability AI zaprezentowało Stable Virtual Camera, narzędzie przekształcające obrazy 2D w wideo 3D z kontrolowanymi ruchami kamery, takimi jak obroty 360°, spirale i zoomy. To może zrewolucjonizować tworzenie treści wideo, szczególnie w marketingu i rozrywce.

8. Gemini Canvas i Audio Overview

Gemini od Google teraz oferuje Canvas do pisania, edycji i podglądu kodu lub dokumentów w czasie rzeczywistym, oraz Audio Overview generujące podsumowania w formie podcastów prowadzonych przez AI:
• Przeglądy audio zamieniają dokumenty w podcasty
• Udostępniane wdrożenia w subdomenach
• Czysty, nowoczesny UI
• Wyszukiwanie w Deep Reasoning.
X post Google Gemini App

Subscribe to keep reading

This content is free, but you must be subscribed to Ainsider AI Newsletter to continue reading.

Already a subscriber?Sign In.Not now