U-22プログラミングコンテスト、「ハンズラボ賞」は「Shrift OCR Engine」に!
去る10月5日(日)、U-22プログラミングコンテストの最終審査会が行われました。
秋葉原で開催された審査会は4時間近くにわたり、ノミネートされた20作品の応募者がプレゼンを行いました。
同賞はその名の通り、22歳以下を対象としたプログラミングコンテスト。今回から参加上限が2歳上がり、上は過去に受賞経験のある大学4年生、下はアプリに使用したイラストや英語音声までをすべて自作したマルチな小学5年生までが、熱いプレゼンを繰り広げました!
各賞および作品の詳細については、U-22プログラミングコンテストのページでご覧ください。
そして、「ハンズラボ賞」は、手書き日本語文字認識エンジン「Shrift OCR Engine」を開発した東京大学 理科Ⅰ類 2年の包含さんに贈らせていただきました!
同作品はスマホ・タブレット等で手書きした文章の画像から、自動的に文字を抽出します。手書きの画像からまず文字を抽出し、その後書かれた字を認識するという難易度が高めの処理に挑戦した意欲作です。
包さんからの受賞コメントをいただきました。
――作品のねらいを教えてください。
包さん:昨今のモバイルデバイスの普及に伴なって、メモやノートをタブレット等で取る学生が増えつつあるように見えます。
しかし、現状タブレットでノートを取っても結局は画像で保存することしかできず、ほとんどがテキスト情報であるにもかかわらずデータとして冗長になりますし、またテキストに対する検索利便性も失われています。
そういった問題点を解決するために、「手書きの文字をコンピュータが認識できたらいいのではないか」と考え、開発したのが今回の手書き文字認識エンジンであるShrift OCR Engineになります。
ちなみに、名前の由来はドイツ語のSchrift(=文字)なのですが、githubのリポジトリを作るときにスペルミスしてしまい、そのまま引きずっています(笑)
――今後の目標はありますか?
包さん:Shriftは機械学習を用いて文字認識を行っていますが、まだまだ精度向上の余地は残されています。
単純に機械学習のチューニングを行ったり、良質な学習データセットを大量に用意したり、認識結果を単語辞書に付き合わせてみたり、はたまた機械学習にヒューリスティックな手法を混ぜてみるなど、やることはたくさんあるのでこのエンジンの開発を更に進めていきたいです。
また、純粋に機械学習に興味を持っていて、機械学習の究極の応用分野として人工知能をつくってみたいというのは中学生の頃から夢見てきました。
今回のU-22プログラミング・コンテストの参加者でも、人工無能とはいえオリジナルの感情モデルを作り、ユーザと簡単な会話を交わせるプログラムを開発されていた方もいらっしゃって、大変興味を持ちました。
機械学習というのは応用分野が大変広く、まるで本当にコンピュータが自分で思考しているかのように多くのタスクをこなすことができます。
こういった技術を更に磨いていき、世界を変えていくことができたならば幸いです。
包さん、ありがとうございました!
今後のご活躍をハンズラボ一同お祈りしております。