OPPO, une des principales marques mondiales de smartphones, a récemment pris part à la conférence sur la vision par ordinateur et la reconnaissance des formes (CVPR) 2020.
OPPO a démontré ses forces technologiques de pointe et ses percées innovantes, en particulier dans le domaine de l’IA, ainsi que le dévoilement d’un nouveau département de perception et d’interaction intelligentes pour explorer les technologies de pointe de l’IA dans leur institut de recherche. Le succès d’OPPO a été mis en évidence en participant à trois concours différents, remportant deux premiers et deux troisièmes prix aux défis du CVPR 2020.
Les technologies ayant remporté les prix comprennent : la technologie de super-résolution extrême perceptuelle, qui peut rendre une photo floue 16 fois naturellement plus nette, la localisation visuelle, pouvant dire où a été prise la photo en analysant l’image, et la reconnaissance de l’activité humaine dans les vidéos.
En outre, les membres de l’équipe de recherche et de développement d’OPPO ont participé à plusieurs sessions de la conférence ; en prononçant notamment des discours liminaires et en participant à des séminaires afin de partager leurs idées sur les technologies de vision par ordinateur avec des milliers de chercheurs de renommée mondiale.
CVPR est un événement annuel de premier plan sur la vision par ordinateur organisé par l’IEEE (l’Institut des ingénieurs électriciens et électroniciens). Il couvre tous les aspects de la vision par ordinateur et de la reconnaissance des formes, de l’apprentissage automatique et de l’IA, et offre une valeur exceptionnelle aux étudiants, aux universitaires et aux chercheurs de l’industrie.
Eric Guo, scientifique en chef, Intelligent Perception, OPPO, a déclaré : « Nous sommes très heureux d’avoir obtenu des résultats remarquables au nom d’OPPO dans les défis CVPR de cette année, reflétant trois de nos directions de recherche principales : la perception environnementale, l’informatique centrée sur l’humain et la génération d’images / vidéos. Il s’agit là de la première démonstration publique de nos résultats de R&D depuis la création du département de recherche sur la perception et l’interaction intelligentes de l’Institut de recherche OPPO, qui reflète aussi pleinement la force d’OPPO en matière d’IA. »
« Nous savons tous que l’invention de la souris et de l’interface utilisateur graphique a contribué au succès de l’ordinateur personnel et l’écran tactile mérite beaucoup de crédit pour le succès et l’essor des smartphones. Chaque fois que le mode d’interaction homme-ordinateur et la technologie de perception intelligente évoluent, ils mènent à une nouvelle tendance technologique. Chez OPPO, nous nous engageons à rendre les appareils connectés encore plus intelligents, afin qu’ils comprennent mieux les utilisateurs. Nous pourrons ensuite développer une nouvelle méthode d’interaction homme-machine afin de mener la prochaine vague de progrès technologique », a-t-il ajouté.
OPPO estime que l’exploration de pointe dans le domaine de la perception et de l’interaction intelligentes habilitera pleinement les technologies et produits OPPO à l’avenir, ce qui fournira aux utilisateurs une méthode et une expérience d’interaction plus innovantes.
OPPO US Research Center a également participé au CVPR 2020 et a remporté une 6ème place au défi de super-résolution du monde réel, piste 1 : artefacts de traitement d’image. Meng Zibo, directeur du Spacetime Lab de l’OPPO US Research Center, a prononcé un discours accompagné d’une keynote sur les principales recherches de l’institut en matière de photographie en basse lumière assistée par l’IA intitulé « Regarder dans le noir : de l’image à la vidéo », et Shuxue Quan, directeur principal de la vision par ordinateur et IA, a prononcé un discours sur la localisation et la cartographie intitulé « Construire un système SLAM unifié fonctionnant à la fois sur smartphone et sur verre RA à partir de zéro ».
Défi Perceptionnel de Super-Résolution Extrême
Lors de ce défi, l’équipe de recherche OPPO a été chargée de résoudre le problème de la super-résolution extrême perceptuelle pour une seule image avec un facteur d’agrandissement x16. L’objectif était d’obtenir un modèle capable de produire des résultats de haute résolution avec la meilleure qualité perceptuelle et la meilleure correspondance à la réalité. L’équipe a développé et démontré l’efficacité de son propre réseau de neurones appelé RFB-ERSGAN, battant 280 autres participants avec son analyse plus intelligente, un calcul plus efficace et des méthodes plus diversifiées, remportant finalement la première place parmi les équipes de Facebook, Baidu, Microsoft, Amazon et la Chinese Academy of Science.
La technologie sera utilisée dans un certain nombre de scénarios. Par exemple, elle pourrait aider les utilisateurs à changer les photos LR prises par leur smartphone en images HR plus riches en détails. D’autres applications pourraient inclure : la restauration de photos et de films anciens ou endommagés ; l’affinage d’images médicales importantes ou l’analyse détaillés des images satellites et spatiales.
Défi de la localisation visuelle pour les appareils portables
Arrivée à la première place en localisation visuelle extérieure (Aachen Jour-Nuit) et à la troisième place en localisation visuelle intérieure (InLoc), OPPO a créé un pipeline de localisation visuelle monoculaire qui exploite les indices sémantiques et de profondeur pour trouver avec précision l’emplacement demandé de toute image. Surmontant un obstacle majeur pour de nombreuses applications de vision par ordinateur – qui consiste à identifier et à éliminer une quantité significative de résultats incorrects, cette méthode a fonctionné de façon magistrale grâce à une robuste expérimentation.
Les utilisations futures probables incluent la réalité augmentée, la robotique intelligente ou la navigation précise. Par exemple, lorsque l’assistant AI est équipé d’une caméra, il peut tirer parti de la technologie de localisation visuelle pour analyser les photos prises et obtenir un positionnement précis et se déplacer ainsi au bon endroit.
Détection d’activité dans les vidéos étendues
Afin d’avoir gagné la troisième place dans la détection d’activité dans les vidéos étendues, et pour effectuer cette tâche en encourageant la conception d’algorithmes de détection automatique d’activité, OPPO a construit les siens afin d’identifier et de réorganiser efficacement les personnages dans chaque image et reconnaître des dizaines d’activités humaines dans des vidéos dynamiques complexes. Cette technologie jouera un rôle important dans les domaines de l’interaction homme-ordinateur et de l’analyse vidéo sportive à l’avenir. Par exemple, le futur smartphone pourra identifier automatiquement les sujets en mouvement et ajuster la mise au point de l’appareil photo en conséquence.
Nouveau département de perception et d’interaction intelligentes
En plus de ses performances lors des défis du CVPR 2020, l’OPPO Research Institute a annoncé qu’il avait créé plus tôt cette année, un nouveau département de perception et d’interaction intelligentes, marquant ainsi le début d’une nouvelle ère d’exploration des technologies d’IA de pointe par OPPO. Son objectif premier est de promouvoir vigoureusement la recherche et le développement dans les deux principaux domaines de la perception et de l’interaction intelligentes.
Eric Guo – scientifique en chef de ce département, a travaillé pour Microsoft en tant que chercheur et a mené plusieurs recherches de pointe au fil des ans. Ses modèles de vision par ordinateur sont largement utilisés dans de nombreuses solutions industrielles telles que la recherche d’images, le graphe de connaissance, le cloud intelligent et la mobilité intelligente.
OPPO a mis en place dès 2015, une équipe pour explorer le domaine de l’IA, notamment dans les branches de la phonétique et de la sémantique, ainsi que celle de la vision par ordinateur. En mars 2020, OPPO avait déposé plus de 1 900 demandes de brevet dans le domaine de l’IA dans le monde. Ces efforts soutiendront OPPO dans l’ère 5G et même 6G en développant de nouveaux appareils et en servant de base technique solide pour le futur de la connectivité intelligente.
À ce jour, OPPO a constitué une équipe de recherche de plus de 10 000 personnes, six instituts de recherche et quatre centres de R&D à travers le monde. De plus, le fondateur et PDG d’OPPO, Tony Chen, a déclaré que la société investirait 50 milliards RMB (environ 7 milliards US$) dans les dépenses de R&D au cours des 3 années à venir pour développer des technologies de base dans le matériel, les logiciels et les systèmes, en plus de la 5G, de l’IA, de l’AR et des méga données et autres technologies de pointe.