Google запустил свою мультимодальную GPT - Google Gemini

⚡️ Google запустил свою мультимодальную GPT - Google Gemini

Команда GoogleDeepMind, GoogleResearch и другие специалисты Google создали Gemini, новое семейство мультимодальных моделей AI, продемонстрировавших выдающиеся возможности в обработке изображений, аудио, видео и текста. Самая мощная модель этого семейства, Gemini Ultra, устанавливает новые стандарты в 30 из 32 тестов, включая текстовые и рассуждения, понимание изображений, видео и распознавание речи. Gemini Ultra первой достигла уровня экспертов по MMLU в 57 предметах, показав результаты выше 90%. Также модель установила новый рекорд в 62.4% на MMMU, превзойдя предыдущую лучшую модель более чем на 5 процентных пунктов.

Gemini предлагает широкий спектр возможностей, начиная с образования и заканчивая различными сферами применения. Например, модель способна читать неразборчивый почерк, понимать сформулированные задачи, переводить их в математические уравнения, выявлять ошибки и предлагать правильные решения. Gemini внедрена в ряд продуктов Google, включая Bard от Google и скоро будетдоступна через API на Google AI Studio и Google Cloud Vertex AI.

По тестам Google Gemini обгоняет ChatGPT 4 от OpenAI.

📝 Main blog post: https://blog.google/technology/ai/google-gemini-ai
📚 Technical report: https://deepmind.google/gemini/gemini_1_report.pdf
🧪 Website: https://deepmind.google/gemini
🧪 Demo: https://bard.google.com

МР.