Cette série de chroniques présentera des interviews mettant en lumière la "technologie" et les "personnes" qui soutiennent RICOH360 au cours de quatre articles afin de mieux les connaître.

 Le thème du premier numéro est la technologie de traitement d'image utilisant l'IA. Nous avons interviewé deux ingénieurs sur l'enthousiasme qui règne en coulisses et dont nous n'aurions pas eu connaissance, notamment des exemples d'utilisation de la technologie de traitement d'image dans RICOH360 et la passion insatiable pour la recherche et le développement de la super-résolution.

L'application est une étape pour l'utilisation pratique

 Pour RICOH360, diverses fonctions ont été développées en utilisant la technologie de l'IA. Par exemple, dans les visites virtuelles de biens immobiliers, des images fixes et des vidéos peuvent être automatiquement découpées à partir d'images à 360 degrés et des meubles de synthèse peuvent être placés pour des simulations (figure 1).

 De nombreuses technologies d'IA ont déjà été diffusées dans le monde entier. Cependant, M. Odamaki, responsable du développement, affirme qu'il est difficile de fournir des services en les utilisant telles quelles.

ricoh360technology01-png

Makoto Odamaki

Directeur du Bureau de développement technologique
-----

A rejoint Ricoh en 1997. Chercheur invité à l'Université de Colombie de 2014 à 2016.

Au cours de sa carrière, il a dirigé le développement de la vision par ordinateur et des technologies liées à l'IA pour les images à 360 degrés.

Son hobby est de visiter les boutiques BOOK-OFF (magasins de livres d'occasion). Ces derniers temps, il est obsédé par l'histoire du monde.

"Bien qu'il existe diverses fonctions, elles sont assurées par l'application de technologies de base. Il existe de nombreuses technologies liées à l'IA dans le monde. Cependant, il est un peu difficile de les utiliser réellement dans des produits ou des services. Le premier problème est la "barrière des licences pour l'utilisation commerciale" et le second est la "barrière du développement à un niveau pratique". Inutile de dire que nous ne pouvons pas utiliser quelque chose en enfreignant les licences, nous devons donc être prudents à ce sujet dès la première étape. Il existe un exemple concernant le niveau pratique. Lors de l'analyse des images d'un salon, l'IA est utilisée pour détecter les portes et les placards. Cependant, dans une analyse générale, il est difficile de faire la distinction entre une porte fermée que l'on peut franchir et une porte de placard que l'on ne peut pas franchir. Même les humains peuvent ne pas être capables de les identifier en regardant simplement des images. Par conséquent, un cycle où nous créons de nouvelles définitions et apportons des améliorations en vue d'utilisations pratiques est nécessaire."

image1
Figure 1 : Mise en scène virtuelle RICOH360 AI

 "AI Image Enhancement" dont la première version a été annoncée en juillet 2020 a été développée grâce à de tels essais et erreurs. Cette technologie, où la "super-résolution" pour la conversion ascendante d'images à basse résolution est mise en pratique, est le fruit d'une idée unique de Ricoh. Nous avons pris note de l'appareil photo à 360 degrés "RICOH THETA" et de l'appareil photo numérique compact haute performance "GR" de Ricoh. Nous avons pensé utiliser le GR, avec une haute résolution et moins de bruit, et le THETA, avec une résolution plus faible et plus de bruit que le GR, comme une paire, et faire en sorte que l'IA apprenne les images acquises par ces deux appareils. En plus des différences entre les objectifs, la conception de la balance des blancs, la reproduction des couleurs et d'autres caractéristiques sont différentes. Nous avons dû faire preuve de créativité pour que l'IA apprenne des "images dans des conditions complètement différentes" en les comparant. En conséquence, nous avons mis au point un algorithme sophistiqué capable de réduire le bruit et de corriger les aberrations chromatiques éventuelles, en plus des améliorations apportées à la résolution. Certains de ces résultats ont été annoncés lors de l'atelier OmniCV2 de la conférence CVPR20201, qui est une conférence de premier plan dans le domaine de la vision par ordinateur."

1 : La conférence sur la vision par ordinateur et la reconnaissance des formes. C'est une conférence qui fait autorité dans le domaine de la vision par ordinateur et de la reconnaissance des formes. Elle rassemble plusieurs milliers de personnes issues des communautés de l'IA, de l'apprentissage automatique et de la vision par ordinateur du monde entier.

2 : Vision par ordinateur omnidirectionnelle dans la recherche et l'industrie

Poursuivre au-delà de l'apprentissage automatique

 La recherche et le développement pour de nouvelles améliorations de la qualité se sont poursuivis même après la sortie en 2020. Cette fois, l'objectif était d'améliorer la qualité de l'image de manière plus complète, au lieu d'améliorer uniquement la résolution, la réduction du bruit et la correction des aberrations chromatiques. Cependant, la qualité de l'image présente des caractéristiques très problématiques. La question qui se pose réellement est la suivante : "Qu'est-ce qui définit une bonne qualité d'image ?" - Bien que des axes d'évaluation basés sur des valeurs numériques puissent s'appliquer, certains aspects sont toujours laissés à la perception de chaque individu. Nous nous sommes entretenus avec M. Suito, qui a effectué les réglages pour améliorer la qualité de l'image.

★IMGP2954

Hiroshi Suito

------

Il a rejoint Ricoh en 2003. En tant qu'étudiant, il s'est engagé dans des recherches sur l'intelligence artificielle.

Au cours de sa carrière, il a travaillé sur le développement de micrologiciels pour les appareils photo numériques et, plus récemment, sur le traitement d'images à 360 degrés et la mise en œuvre de l'IA Virtual Staging.

Il aime regarder les matchs de baseball et faire du jogging.

"'L'évaluation mathématique' et 'l'évaluation perceptive' sont considérées comme difficiles à concilier. Souvent, les chiffres sont bons, mais les résultats ne sont pas aussi bons visuellement, ou vice versa. Cependant, il est également difficile de verbaliser ou de formuler les niveaux d'acceptation sensorielle, donc dans le réglage, la voix des clients qui utilisent réellement le produit devient importante."

 Même ainsi, il peut être difficile de recueillir les commentaires des clients, ou les statistiques pourraient potentiellement être biaisées. Toutefois, M. Suito avait déjà travaillé sur des appareils photo numériques destinés aux consommateurs et avait déjà répondu à diverses demandes liées à la qualité de l'image.

"Nous recevons beaucoup de commentaires de clients ayant des préférences particulières, comme : "Bien qu'il ait été mis à jour, je préférais les teintes de la dernière version", ainsi que : "Les couleurs semblent étranges dans cet environnement". Il arrive que les mises à jour d'un nouveau modèle à visée technique ne soient pas bien acceptées.

 Il était très difficile de répondre à chaque demande une par une, mais grâce à des communications répétées, j'ai développé une règle empirique telle que "Ceci est acceptable" ou "Ceci est probablement inacceptable". L'expérience d'être si proche de la voix des clients m'aide à évaluer la qualité des images aujourd'hui."

image11
Figure 2 : Gauche : image originale Droite : Image corrigée par l'IA

 Ainsi, l'amélioration de l'image par l'IA mise à jour en septembre 2022 a permis d'améliorer globalement la qualité de l'image au-delà de la super-résolution en revoyant la structure du réseau et en combinant plusieurs traitements d'image par l'IA tels que la reconnaissance de scènes (figure 2).

 Tout en utilisant les dernières technologies d'IA, complétez les sens délicats par des mains humaines. En faisant tourner ces deux roues, des données d'apprentissage de bonne qualité ont été identifiées, et un modèle d'amélioration qui "obtient de meilleurs résultats avec moins de données qu'auparavant tout en étant deux fois plus rapide" a été mis au point.

 De plus, en ce qui concerne l'évaluation de la qualité de l'image, il semble qu'il y ait un axe d'évaluation et une spécialité cultivée dans chaque entreprise. Tout comme d'autres fabricants, Ricoh dispose d'une équipe dédiée à la "qualité d'image". Le savoir-faire accumulé pendant de nombreuses années a été hérité comme l'ADN, et ce bâton sera transmis à la prochaine génération.

"Lorsque nous avons effectué un test d'évaluation de la qualité d'image en interne, M. Suito et moi-même avons été presque unanimes dans nos réponses. Il se peut que la préférence et la qualité des images aient déjà été héritées dans l'organisation", déclare M. Odamaki.

 Une nouvelle amélioration de la qualité sur deux ans. L'année 2022 a été un grand bond en avant, mais ils discutent déjà des futures mises à jour.

"En tant qu'équipe, nous espérons transmettre les compétences que nous avons développées jusqu'à présent, tout en renforçant notre coopération avec les autres équipes", ont-ils déclaré. En vue du lancement de RICOH360 SaaS plus a Box, des activités visant à favoriser l'interaction et le développement des ingénieurs seront menées sur le matériel, les logiciels et le cloud.

RÉFÉRENCES

En savoir plus sur l'amélioration des images par l'IA

https://www.ricoh360.com/tours/features/image-enhancement/