Doubao, l'assistant qui pilote le téléphone à votre place
Un agent IA qui ouvre vos applications, compare les prix et achète à votre place : la grille d'icônes recule. Ce qu'on y gagne, ce qu'on y délègue.
En janvier 2026, un téléphone discret est parti en quelques heures. La nubia M153, fabriquée par ZTE et vendue 3 499 yuans, soit environ 470 euros, à trente mille exemplaires réservés aux développeurs. Sa particularité n'était ni son écran ni son appareil photo, mais le logiciel qui l'animait : Doubao, l'agent conversationnel de ByteDance, la maison mère de TikTok, intégré au niveau du système d'exploitation. Sur cet appareil, on ne tape plus sur des icônes. On parle, et l'agent ouvre les applications à votre place.
Ce prototype chinois n'est pas un cas isolé. Le 16 juin, le patron de Qualcomm, Cristiano Amon, a déclaré que les agents IA finiraient par remplacer les applications comme interface principale du téléphone, et révélé que son entreprise travaillait sur plus de quarante nouveaux appareils pensés autour de cette idée. Il a appelé 2026 « l'année des agents ». Derrière la formule, une promesse précise : que la grille d'icônes, ce damier que l'on fait défiler des dizaines de fois par jour, cède la place à une seule chose qui comprend ce que vous voulez et le fait.
De la grille d'icônes à l'intention
Le principe rompt avec quinze ans d'habitude. Depuis l'iPhone, se servir d'un téléphone, c'est choisir une application, l'ouvrir, naviguer dans ses menus, puis recommencer ailleurs. L'agent inverse l'ordre : vous formulez une intention, il se charge de la chaîne d'actions. Une démonstration de Doubao montrait l'assistant raconter une histoire à partir d'une photo, effacer les passants d'un cliché, comparer le prix d'un même produit sur plusieurs applications marchandes, puis l'acheter après accord de l'utilisateur.
ByteDance décrit son produit comme « une collaboration au niveau du système d'exploitation » entre son modèle et le constructeur. La nuance compte : l'agent ne vit pas dans une application parmi d'autres, il est posé sous elles, capable de toutes les piloter. Réserver un trajet, passer une commande, télécharger une série de fichiers, suivre un colis sur des plateformes différentes, le tout par la voix, sans ouvrir une seule fois l'écran d'accueil.
Les grands acteurs avancent dans la même direction. Google a présenté Gemini Spark, un assistant qui puise dans vos courriels et vos messages pour exécuter des tâches longues. OpenAI prépare un appareil pour la seconde moitié de 2026. Qualcomm fournit déjà les puces de lunettes, de bagues et d'écouteurs à caméra : autant de formes où il n'y a pas d'écran du tout, donc aucune application à toucher. L'agent y devient la seule interface possible.
Le travail d'exécution rendu à son propriétaire
Ce que cette bascule déplace, c'est le travail d'exécution. Comparer dix prix, remplir un formulaire de réservation, recopier une adresse d'une application à l'autre : ces gestes coûtent peu d'effort mais beaucoup de minutes, répétées chaque jour. Un agent qui les enchaîne sans surveillance rend à l'utilisateur la part la plus mécanique de sa vie numérique.
Le gain n'est pas seulement du temps, c'est de l'attention. Le téléphone moderne est conçu pour retenir : chaque application veut son ouverture, sa notification, son défilement. Un agent qui agit en sourdine court-circuite cette mécanique. On formule une demande, on obtient un résultat, on referme. Pour qui ne veut pas vivre dans son écran, c'est une forme de retrait : la machine travaille, vous restez dehors.
Pour certains publics, la promesse dépasse le simple confort. Une personne âgée qui peine avec les menus, quelqu'un qui voit mal, un utilisateur peu à l'aise avec la technique : l'intention dite à voix haute est une porte d'entrée bien plus simple que la grille d'icônes. Là où l'application exige d'apprendre son fonctionnement, l'agent demande seulement de dire ce que l'on veut.
Ce que l'on délègue vraiment
Reste à mesurer le prix de cette délégation. Pour agir à votre place, l'agent doit tout voir : vos messages, vos courriels, vos comptes, vos habitudes d'achat. Gemini Spark l'assume, il puise « dans votre compte Google ». Là où une application cloisonnait ses données, l'agent les rassemble pour fonctionner. Le confort se paie en visibilité : une seule entité connaît désormais l'ensemble de ce que vous faites sur l'appareil.
Il y a aussi la question du choix. Quand l'agent compare dix prix et en retient un, sur quel critère tranche-t-il ? Quand il achète « après accord », jusqu'où va l'accord ? Celui qui contrôle l'agent contrôle la première décision, celle qui oriente tout le reste. Une grille d'icônes laisse l'utilisateur libre de son chemin ; un agent en propose un déjà tracé, et l'on découvre rarement ceux qu'il n'a pas pris.
Enfin, la dépendance change de nature. Une application qui plante, on en ouvre une autre. Un agent devenu la seule porte vers le téléphone concentre le risque : sa panne, son erreur, sa lecture de travers d'une consigne ont des conséquences que l'on ne voit pas toujours venir, faute de suivre chaque étape. Acheter le mauvais billet, écrire au mauvais contact, régler deux fois : l'autonomie déléguée suppose une confiance que rien, pour l'instant, ne garantit.
La vraie bataille
Ce qui s'ouvre n'est donc pas la course au meilleur assistant, mais la bataille de l'interface elle-même. Celui qui possède l'agent possède la couche par laquelle passe tout le reste, et reléguera les applications au rang de simples fournisseurs invisibles. ByteDance, Google, OpenAI et Qualcomm ne se disputent pas un marché de plus : ils se disputent la place qu'occupait, depuis 2007, l'écran d'accueil.
Pour l'utilisateur, la vraie question n'est pas de savoir si l'agent saura piloter le téléphone, les démonstrations montrent qu'il y parvient déjà. C'est de décider ce qu'il accepte de ne plus faire lui-même, et à qui il confie ce pouvoir. Le téléphone sans applications promet de rendre du temps et de la simplicité ; il demande en retour de laisser une machine, et l'entreprise derrière elle, décider à votre place. Le marché tranchera vite. À chacun de peser, avant, ce qu'il met dans la balance.