[インタビュー]LINEのAIプロダクトをより良いものに「CLOVA OCR」の「データ作成・分析」

[インタビュー]LINEのAIプロダクトをより良いものに「CLOVA OCR」の「データ作成・分析」 サムネイル画像

【お知らせ】2023年10月1日にLINE Fukuoka株式会社からLINEヤフーコミュニケーションズ株式会社へ社名を変更しました。2023年9月30日以前の記事には旧社名で記載しています。

「LINER~私のシゴト~」では、LINE Fukuokaで活躍するLINERたちのシゴトの魅力やキャリアについてご紹介していきます。
今回ご紹介するのはAI運営室にてCLOVA OCRの精度向上を担うAI Data Operationパートのシゴトです。組織を牽引する金杉にインタビューしました。

金杉 亮佑
AI運営室 AI Data Operationパート アシスタントマネージャー
前職は金融機関。2018年LINE Fukuoka入社。LINE Pay加盟店審査の業務を経て2020年よりAI運営室に異動。CLOVA OCRの学習データ構築を担うパートにて組織をリード。

 

─ これまでのキャリアと入社のきっかけを教えてください

無題-2

金杉

前職は金融機関で営業をしていました。金融機関で働く中で、FintechやDXというワードを耳にする機会も増え、少しずつIT業界に挑戦をしたいなと考えるようになっていきました。そんなときにLINE Fukuokaの求人でLINE Pay加盟店審査というポジションを見つけ、まさに自身の関心の強いIT×金融の領域だと感じたんです。そんなご縁もあり2018年10月にLINE Fukuokaに入社をし、LINE Payの加盟店審査を行う部署にてオペレーターとしてキャリアをスタートしました。
2020年2月に現在のAI運営室に異動し、AI Data OperationパートにてCLOVA OCRの精度向上に必要となるデータ作成(アノテーション)やメンバーのマネジメントを中心に日々業務に取り組んでいます。

ocr_1
─AI運営室とはどのような部署ですか?

無題-2

金杉

文字通りですが、LINEが取り扱うAIプロダクトの性能評価、精度向上、アノテーション、テクニカルサポート、カスタマーサクセスなど、BtoB、BtoC問わず幅広く運営を行っている部署になります。
AIプロダクトの企画自体は東京のLINE側で行っているのですが、LINE Fukuokaではそのプロダクトをより良いものにしていくための運営を行っているというイメージです。
AI運営室は、ただ運営をするということではなく、「事業成長の直接的な要因を私たちが担っている状態になっていること」、というミッションを掲げ、日々業務に取り組んでいます。ユーザーの声と真摯に向き合い、その声をAIに取り込み、グループ一丸となってサービスの品質向上のために努力しています。
ocr_3

 

─ 具体的にどんな業務を行っていますか?

無題-2

金杉

私は、AI運営室の中でもAI Data Operationというパートで仕事をしています。CLOVA OCRの精度向上を目的とした学習データを構築するチームです。と言ってもなかなかピンとこないですよね。。CLOVA OCRは、紙面・画像に記載された文字・文章をテキストデータへ変換するサービスです。伝票や領収書の登録、身分証明証のモバイルアプリ上における情報入力など、煩雑な入力作業を簡単にし、手入力の時間を大幅に削減することができます。

私のチームでは、CLOVA OCRの文字認識精度、項目分類精度を向上させることを目的として、AIに学習させるためのデータ作成(アノテーション)を行います。ユーザーニーズに合わせて、①OCR結果のテキスト修正、②テキストの意味に合わせたラベリングといった作業を行うことで正解データを作成し、そのデータを開発チームへ連携することでAIへの学習が行われます。委託企業様と共同でオペレーションを行っており、ユーザー目線とチーム連携を強く意識したプロジェクト設計・進行が肝となる業務です。

OCR結果のテキスト修正
テキストの意味に合わせたラベリング
 

─仕事のやりがいを教えてください

無題-2

金杉

開発チームにて私たちが作ったデータを実際にAIに学習させ、新バージョンがリリースされていくのですが、その際に認識率が何%向上したというデータが開発チームから共有されます。

私たちの行った業務によってサービスの品質向上に繋がったと実際の数値を見ることができた際は大きなやりがいを感じます。また、VOCを通してユーザーからの声も聞くことが出来るので、これまではAIで認識できなかったものが認識できるようになったという声が聞けると非常に嬉しい気持ちになります。
代表的な実績として、国立国会図書館様の「デジタル化資料のOCRテキスト化」プロジェクトがあります。
LINEが作業を受託してCLOVA OCRの技術によるモデル開発を実施、すべての画像データをテキストデータ化するプロジェクトで、LINE Fukuokaはモデル開発に向けた1万枚のデータ作成(アノテーション)を担当しました。作成する学習データがOCRの精度を大きく左右するため正確な作業が必要となるのですが、明治~昭和初期の書籍を人の目で読み取りテキストの修正を行う作業は非常に難易度が高く、総勢50名体制での作業となったことも重なり、全員の作業基準を統一するのに大変苦労しました。最終的に非常に精度の高いOCRモデルが出来上がり、プロジェクトが完了した際は、これまでにない安心感と達成感がありました。

 
画像1-Oct-20-2022-09-32-12-87-AM
※LINE Fukuokaの成果物は国会図書館様により一般公開されています。
https://github.com/ndl-lab/pdmocrdataset-part1
 
ocr_2
 

─どんな方と働きたいですか?

無題-2

金杉

大きく二つあります。一つ目は、ユーザーの目線に立って仕事に取り組むことができる方です。
私たちの仕事はユーザーの期待に応えるために品質を向上させていくというものになるので、常にユーザー目線をもって、どうしたらユーザーにとってより良いサービスになるかという視点を持ってこれまで仕事をしてきた方は非常にマッチすると思います。

二つ目は、ありきたりかもしれないですが、チームワークを大事にしながら業務を進めることができる方です。プロジェクトはチームで進めていくため、報告・連絡・相談はもちろんですが、自分の意見をしっかりと言いつつも、相手の意見にもしっかりと耳を傾けてチームとしての認識をすり合わせるということが非常に大切です。積極性と協調性のバランスが取れているような方は、この仕事に向いていると思うので、そういった方と一緒に仕事が出来たらなと思います。

 
─ 最後に
 

無題-2

金杉

AIやデータ分析と聞くと、とっつきにくそうな印象があるかもしれません。しかし、実際に私のチームで仕事をしているメンバーのほとんどが業界の経験は無い状態から業務をスタートしています。

アパレル業界や医療業界などバックボーンは多種多様ですが、私たちの部署では「目的を持って動ける集団&どこでも活躍できる人材」という人材育成方針を掲げており、研修やOJT制度も整えているので、未経験から業務をスタートされる方でも段階を追って着実にスキルアップ出来る環境があります。

また、LINEではAI事業を「戦略事業」として位置づけており、アジアNo.1のAIテックリードカンパニーを目指し、積極的に事業展開しています。より便利な暮らしを実現していくサービスを運営する一員として、主体性と柔軟性をもってチャレンジしていきたいという方からのご応募をお待ちしています。
 
LINE Fukuokaでは福岡から“WOW”を生み出すべく、共にチャレンジする仲間を募集しています!
今回インタビューをしたAI運営室の「データ作成・分析/AIプロダクト」に関連する募集はこちらからご覧ください。
 

LINEヤフーコミュニケーションズ
公式SNS

ブログ記事更新のお知らせやLINEヤフーコミュニケーションズの最新情報を配信中!