Google I/O 2024 : les 10 annonces clés à retenir

Tour d’horizon détaillé des annonces alléchantes du Big Tech Show de Google – alias AI In Everything.

La plus grande nouveauté de Google I/O 2024 ? Nous avons ce qu’il vous faut. Après avoir regardé le discours d’ouverture en direct tout en griffonnant furieusement des notes, nous vous avons servi ci-dessous un plateau de petites annonces savoureuses. Alerte spoiler : l’IA est partout.

Demandez des photos
Google Photos introduit une nouvelle fonctionnalité expérimentale appelée Ask Photos, optimisée par les modèles Gemini AI. Ask Photos permet aux utilisateurs de rechercher dans leur photothèque de manière plus intuitive, en utilisant des requêtes en langage naturel telles que « Montrez-moi la meilleure photo de chaque parc national que j’ai visité ». Ask Photos vous aide également dans des tâches telles que la sélection des points forts du voyage et la génération de légendes : demandez-lui simplement les meilleures photos de votre voyage à l’étranger, et il vous fournira instantanément une sélection organisée de certaines de vos meilleures photos. Google insiste sur les protections de confidentialité en place, précisant que les données personnelles ne sont jamais utilisées à des fins publicitaires et sont protégées par des mesures de sécurité de pointe. La fonctionnalité Ask Photos sera déployée auprès des utilisateurs dans les mois à venir.

Veo : vidéos générées par l’IA
La génération d’images a déjà époustouflé par son développement rapide ces dernières années, et la même chose semble se profiler à l’horizon pour la vidéo. Lors de l’I/O 2024, Google a dévoilé Veo, un nouveau modèle de génération vidéo puissant capable de créer des vidéos 1080p de haute qualité sur une minute, dans différents styles cinématographiques. Veo possède une compréhension avancée du langage naturel et de la sémantique visuelle, ce qui lui permet de capturer avec précision le ton et les détails d’une invite, tout en respectant les lois de la physique pour un mouvement réaliste et naturel. Très impressionnant en effet. Google collabore avec des cinéastes et des créateurs pour expérimenter Veo et améliorer la façon dont ils conçoivent, construisent et déploient le modèle afin de soutenir au mieux le processus de narration créative. Veo est actuellement disponible pour certains créateurs en avant-première privée, et prévoit d’apporter sa magie à YouTube Shorts et à d’autres applications à l’avenir.

Imagen 3 : le meilleur modèle texte-image de Google à ce jour
Google a également dévoilé Imagen 3, son modèle texte-image le plus avancé à ce jour, capable de créer des images photoréalistes très détaillées avec beaucoup moins d’artefacts visuels par rapport aux versions précédentes. Une chose que nous sommes particulièrement impatients de tester est l’amélioration du texte rendu par l’IA dans les images, ce avec lequel les modèles actuels ont du mal. Si cela fonctionne aussi bien que annoncé, cela pourrait ouvrir un tout nouveau monde de génération de contenu. Cartes d’anniversaire IA sur mesure, nous voilà.

Circle to Search sauve vos devoirs
Circle to Search, une fonctionnalité déjà disponible sur divers appareils Pixel et Samsung, permet aux utilisateurs de rechercher n’importe quoi sur leur téléphone d’un simple geste sans changer d’application. À I/O 2024, Google a annoncé avoir étendu les capacités de Circle to Search pour aider les étudiants à faire leurs devoirs directement depuis leurs appareils mobiles. En encerclant un point difficile, les élèves peuvent recevoir des instructions étape par étape pour résoudre des problèmes de physique et de mathématiques. Plus tard cette année, la fonctionnalité sera améliorée pour résoudre des problèmes plus complexes impliquant des formules symboliques, des diagrammes et des graphiques, optimisés par LearnLM, la nouvelle famille de modèles axés sur l’apprentissage de Google. Circle to Search devrait doubler sa disponibilité d’ici la fin de l’année, ce qui pourrait donner aux enseignants le temps de se préparer à l’assaut des devoirs générés par l’IA.

Gemini sur Android
Google améliore également son assistant Gemini AI sur Android afin qu’il puisse mieux comprendre le contexte de ce qui est affiché dans l’application actuelle. et l’application qu’ils utilisent actuellement. Cette expérience générative basée sur l’IA, intégrée au système d’exploitation Android, est appelée à devenir plus polyvalente et conviviale. Bientôt (un délai précis n’a pas été précisé), les utilisateurs d’Android pourront accéder à la superposition de Gemini au-dessus de l’application qu’ils utilisent, permettant une interaction transparente avec l’assistant IA, déverrouillant des actions telles que glisser-déposer des images générées dans Gmail. , Google Messages et d’autres applications. Les abonnés Gemini Advanced pourront également profiter de la fonctionnalité “Demander ce PDF”, qui extrait automatiquement les réponses des documents PDF sans avoir besoin de faire défiler plusieurs pages. Cette mise à jour devrait être déployée au cours des prochains mois. Enfin, Google teste également une nouvelle fonctionnalité basée sur l’IA qui pourrait détecter les signaux d’alarme lors des appels téléphoniques, vous avertissant s’il semble que la personne à qui vous parlez pourrait être un escroc.

Gemini pour la recherche Google
Un nouveau modèle Gemini, personnalisé pour la recherche Google, combine des fonctionnalités avancées telles que le raisonnement et la planification en plusieurs étapes, avec les systèmes de recherche existants de Google. En d’autres termes, c’est la recherche Google, mais en mieux. AI Overviews – une fonctionnalité Labs qui fournit des réponses rapides et des aperçus aux requêtes des utilisateurs en sélectionnant les sources de plusieurs sites – est désormais déployée pour tout le monde aux États-Unis, et prévoit de s’étendre dans le monde entier d’ici la fin de l’année. Bientôt, les utilisateurs pourront ajuster les aperçus de l’IA en simplifiant le langage (utile pour répondre aux requêtes des enfants) ou en décomposant les informations plus en détail. La recherche Google offrira également des fonctionnalités de planification, à commencer par les repas et les vacances. Les utilisateurs peuvent créer des plans de repas personnalisés et les exporter facilement vers Docs ou Gmail. Plus tard cette année, des catégories supplémentaires telles que les fêtes, les soirées en amoureux et les séances d’entraînement seront ajoutées.

Posez des questions avec une vidéo
Vous avez toujours rêvé d’utiliser l’IA pour effectuer des recherches dans du contenu vidéo ? Votre heure est venue, grâce à la nouvelle fonctionnalité de recherche avec vidéo. Un exemple fourni par Google consiste à utiliser la fonction de recherche vidéo pour dépanner un tourne-disque en panne. Au lieu de chercher les mots justes pour décrire le problème, l’utilisateur peut simplement enregistrer une vidéo du comportement inattendu du tourne-disque, comme par exemple le morceau de métal dont l’aiguille dérive de manière inattendue. La recherche avec vidéo sera bientôt disponible pour les utilisateurs de Search Labs en anglais aux États-Unis et s’étendra à davantage de régions dans un avenir (espérons-le) proche.

Gemini 1.5 Pro lit tout
Google a également dévoilé Gemini 1.5 Pro, son modèle d’IA le plus avancé, aux abonnés Gemini Advanced. Son principal attrait est sa fenêtre contextuelle considérablement étendue, ce qui en fait le plus long de tous les chatbots grand public largement disponibles dans le monde. Avec une fenêtre contextuelle aussi longue, Gemini Advanced peut comprendre plusieurs documents volumineux totalisant jusqu’à 1 500 pages, ou résumer 100 e-mails. Dans un futur proche, il sera également capable de traiter une heure de contenu vidéo ou de bases de code dépassant 30 000 lignes.
Pour utiliser pleinement cette vaste fenêtre contextuelle, Gemini Advanced permet désormais aux utilisateurs de télécharger des fichiers directement depuis leurs appareils ou via Google Drive. Cette fonctionnalité permet aux utilisateurs d’obtenir rapidement des réponses et des informations à partir de documents denses, comme comprendre les spécificités d’une politique relative aux animaux de compagnie dans un contrat de location ou comparer les arguments clés de plusieurs longs documents de recherche. Il peut même créer des visualisations et des graphiques personnalisés, basés sur les informations provenant de feuilles de calcul.

Gems, un vrai joyau
Google I/O 2024 a également introduit une nouvelle fonctionnalité pour les abonnés Gemini Advanced appelée Gems, qui permettra aux utilisateurs de créer des versions personnalisées de l’assistant Gemini AI. Avec Gems, les utilisateurs peuvent adapter leur compagnon IA à leurs besoins et préférences spécifiques, qu’ils recherchent un copain de gym, un partenaire de codage ou un guide d’écriture créative, pour ne citer que quelques exemples optimistes. Les utilisateurs doivent simplement décrire ce qu’ils veulent que leur Gem fasse et comment ils veulent qu’il réagisse. Vous pourriez, par exemple, demander : « Vous êtes mon entraîneur de course, donnez-moi un plan de course quotidien et soyez positif, optimiste et motivant. » Gemini prendra ensuite ces instructions et, d’un simple clic, les améliorera pour créer une gemme répondant à vos exigences.

Gmail turbocompressé
L’application mobile Gmail propose également une mise à jour intéressante qui, vous l’aurez deviné, est liée à Gemini. La nouvelle icône Gemini dans Gmail offrira des options utiles, telles que résumer les e-mails, répertorier les prochaines étapes ou suggérer des réponses. Les utilisateurs peuvent également utiliser la boîte de dialogue ouverte pour des demandes plus spécifiques, comme rechercher un document particulier ou poser des questions de discussion pour une réunion à venir.

Google I/O 2024 : les 10 annonces clés à retenir

LES + POPULAIRES