ロボット制御×AIの無限の可能性!注目ベンチャー企業の専門家に聞くAIの最新トレンド【前編】 

ChatGPTの登場によって瞬く間に認知が進んだAI。今では一般の人でも気づかないうちに何らかの形でAIの恩恵を受けており、生活だけでなくさまざまな産業でその利活用が推し進められています。

デバイスプラスは、これまで電子工作やロボコンに関する記事を中心に多くのコンテンツを公開してきましたが、いよいよデバプラにとってもAIは切っても切れない存在となってきました。現にユーザの方々にアンケートを取ったところ、やはりAIに関する質問が多く、その注目度は非常に高いことが伺えました。

 

そこで今回は、ロボットの制御とAIの可能性について、どのような技術があり、今後どのように使われていくのか、専門家の方にお話を聞く機会を得たので、前編と後編の2回に分けて紹介していきたいと思います。

前編となる今回は、機械学習を活用したオーダーメイド型AI「カスタムAI」の開発事業やカスタムAI導入のためのコンサルティング事業を展開する株式会社Laboro.AIより、執行役員エンジニアリング部長を務める吉岡琢さんにお話をお聞きしました。吉岡さんは、Laboro.AIでエンジニアリング部長として強化学習や自然言語処理を中心に業務に従事されているスペシャリスト。そんな吉岡さんに、今後ますます進化していくであろうロボット制御に関するAIのトレンドについて、いろいろとお話をお聞きしました。

吉岡 琢(よしおか たく):株式会社Laboro.AI 執行役員エンジニアリング部長。奈良先端科学技術大学院大学 情報科学研究科 博士後期課程修了(工学)。在学中に確率モデルによる情報処理の研究に従事。修了後、研究所や企業で機械学習による脳活動計測、人流データ分析、深層学習によるロボット制御を経験。2019年4月よりLaboro.AIに参画し、強化学習、自然言語処理を中心に従事。2022年よりエンジニアリング部 部長、2024年より執行役員に就任、部門の指揮を取る。

 

①はじめに

デバイスプラス編集部(以下、編集部):本日はよろしくお願いします。最初に、ロボット制御に関するAIの活用について、具体的にどのようなものがあるのか教えて頂けますでしょうか?

吉岡さん:ロボットというものは、私の中ではいろいろな技術の集大成だと捉えています。現代のロボットは、状況を認識して、ロボットを使うユーザの指示を理解した上で適切に制御するという要素から成り立っていますが、それぞれについて機械学習の分野が対応していると考えています。今日はこれらの「認識」「制御」「理解」といったプロセスに対応する機械学習技術である「画像認識」「強化学習」「LLM(大規模言語)」の3点について紹介していきたいと思います。

②進化を続ける画像認識技術

編集部:それでは最初に画像認識分野におけるAIの活用についてお聞きしたいと思います。この分野はロボコンなどで既に活用が始まっていますので、デバプラを普段読んでくれているユーザの方々もある程度イメージがつきやすいのではないかと思います。

吉岡さん:AIを活用した画像認識とは、2Dや3Dのカメラに映っている画像の物体を認識したり、画像の中のどの部分が地面で、どの部分が空であるかなどを認識する技術です。

編集部:この画像認識は、現在では比較的良く知られている技術だと思いますが、いつ頃から登場したのでしょうか?

吉岡さん:この技術のブレイクスルーと言っていいのが、2012年に登場した一般的に「AlexNet」と呼ばれるディープニューラルネットワークです。ディープニューラルネットワークによって、従来のものと比べて飛躍的に性能が上がり、そこから現在の生成AIに至るまで、AIが爆発的に広がっていくベースとなった研究だと捉えています。ロボコンに参加されている方々でしたら聞いたこともあると思いますが、YOLOのような高速で物体検出ができる技術などはこういったディープニューラルネットワークが使われています。

画像処理のためのディープニューラルネットワークとして、2018年から2020年くらいまでは、コンボリューションニューラルネットワークという、いわゆる畳み込みのフィルタを何層も重ねたようなものが使われていました。ニューラルネットワークとデータの規模を上げることで非常に性能が向上してきて、簡単な物体検出タスクであれば問題なく検出できるようになりました。

編集部:ここ最近では、画像認識技術はどのように進化してきていますか?

吉岡さん:最近は3次元点群データに対する認識精度の向上が進んできています。例えばLiDARやRGB-Dカメラで撮影された点群データには、ディープニューラルネットワークが使われていて、これがロボティクスの世界にも浸透し大きな成果を出してきています。

また、言語処理の分野で広く使われていた「Transformer」という技術が、2020年頃から画像認識にも応用されるようになり、認識精度の大幅な向上に寄与しています。

さらに、画像と言語を結びつけるようなマルチモーダルなモデルも登場しています。これによって、言語で指示を与えたロボットが画像を認識した上で制御するという研究が今まさに進んでいるところです。

編集部:画像認識技術の具体的な事例を教えてください。

吉岡さん:これは当社(Laboro.AI)の事例になりますが、例えば工業製品の周囲に傷などがないか自動でチェックする外観検査に活用していたり、道路の停止線や横断歩道を衛星画像から検出するプロジェクトにディープニューラルネットワーク画像認識技術が使われています。

編集部:画像認識技術を使うことのメリットを教えてください。

吉岡さん:一番のメリットは作業者の負担を大幅に軽減できる点です。例えば、ベルトコンベアで部品が高速かつ大量に流れてくるような状況を考えてみましょう。このような場合、人間が正確に必要な部品を検出するのは非常に困難であり、作業員の数を増やすとコストが大幅に上昇してしまいます。しかし、AIを活用した画像認識技術を導入すれば、高精度な検出が可能となります。また、AIは疲れることがないですから(笑)、長時間にわたって安定して作業を続けることができるのです。

編集部:今後、画像認識技術はどのように応用されていくのでしょうか?

吉岡さん:有望なユースケースのひとつはデジタルツインの領域だと思います。デジタルツインは、現実世界の物理空間やプロセスを仮想空間上に再現する技術です。例えば、工場のデジタルツインを構築することで、運用方法をシミュレーションし、効率化や最適化に向けた施策の検討が可能になります。デジタルツインの構築において、レーザスキャナやカメラを用いて取得した点群データから、空間に存在する物体を検出するために画像処理技術を活用できます。

 

この続きは後編でお楽しみください!

アバター画像

エレクトロニクスやメカトロニクスを愛するみなさんに、深く愛されるサイトを目指してDevice Plusを運営中。

https://deviceplus.jp

出場ロボット解剖計画