▼ 仕事
私が所属するAI技術開発部は、データ本部という組織の中にあります。
会社紹介で少しお話ししたように、DeNAにはゲームやライブストリーミング、スポーツ、ヘルスケアなど様々な事業があるのですが、
データ統括部はこれらすべての事業部を横断するような組織といえます。
それぞれの事業部を技術面でサポートすることはもちろん、ゲームのログやライブ配信の動画・音声といった各事業部に蓄積された膨大なデータを
分析・活用し、既存サービスの改善や新事業開発につなげていく役割も担っています。
私もデータサイエンティストとして、データ分析や施策提案、実稼働する機械システムの実装まで、様々な領域を横断しながら業務に取り組んでいます。
▼ 役割
具体的な仕事内容については、2021年から携わっているPocochaを例にご紹介します。
ライブ配信アプリPocochaは、「配信される動画や音声」「視聴者が投稿するコメント(自然言語)」「アイテムの購入や送付といったユーザーの行動履歴」
「ユーザー同士のフォロー関係(グラフ情報)」など、多種多様なデータを同時に扱うサービスです。
私たちAI技術開発部は、これらの豊富なデータに機械学習を適用し、多様化する配信者の中からおすすめの配信者をユーザーごとに推薦したり、
規約違反の検知を効率化したりするなど、より良いサービスが提供できるよう支援しています。
以下では、規約違反検知のための機械学習の活用について簡単にご説明します。
Pocochaに限ったことではありませんが、
ライブ配信アプリのユーザーには「運転中の配信」「脅迫・誹謗中傷コメント」などの「やってはいけないこと=規約違反」があります。
ライブ配信アプリを健全に運営するためには、こうした規約違反を素早く検知し、速やかに警告や利用停止措置(BAN)といった対応を行うことが欠かせません。
まず、配信者側の違反行為は動画情報を用いて検知されています。Pocochaの配信は24時間体制で人間により監視されていますが、
同時に配信される膨大な動画を均等に監視するのでは効率が悪いため、見回りには優先順位づけが大切となります。
そこで、過去の配信データと人間によるチェックで検知された違反情報などを用いた機械学習により「違反を起こす確率」を推定し
チェックのフローを効率化するなど、人間によるチェックと機械学習が互いに依存し合うループ構造を構築すること(Human in the Loop)によって、
違反の発生から検知・対応までに要する時間の大幅な短縮を実現しています。
参考 https://speakerdeck.com/dena_tech/techcon2021autumn-08?slide=10
一方、誹謗中傷コメントなど視聴者側の違反行為については、自然言語情報を活用して効率的な検知を行います。
従来は古典的なワードマッチなどの手法で違反を検知してきていたのですが、グローバル化が進む現在では多言語を柔軟に扱える仕組みが必要になっています。
この点に関しては、言語が違っても意味が同じであれば似たベクトルになるよう変換する「ベクトル化機能」で対応しています。
この機能でベクトル化されたコメントを、MLP(Multilayer perceptron)などによって「問題なし」「誹謗中傷」「出会い目的」「公序良俗に反する」といった
カテゴリに分類することで、迅速な違反検知につなげています。実際、このモデルで検出された違反候補ユーザーの多くは警告などの対応対象になっています。
参考 https://speakerdeck.com/dena_tech/techcon2021autumn-08?slide=23
Pocochaの急成長やグローバル展開が進むことで審査すべき対象が膨大に増えていく状況の中、このような形で機械学習を組み合わせることによって、
より効率的に違反を検知できるようなシステムの開発・改善に日々取り組んでいます。
▼ 仕事に必要な知識・スキル
物事を深く理解したうえで、それを人にわかりやすく伝えるスキルは重要だと思います。
例えば、実サービスの開発では、施策のABテスト(複数のパターンを比較するテスト)をするためにも多くの人が関わってきます。
もちろん、その中には情報学が専攻でない人もいます。
ここで大切なのは、
「何を言っているのかわからないけど、とりあえずお任せします」というパートナー関係ではなく、お互いの考え方を理解し、意見を交わせることです。
そのため、自分の施策の背後に存在する理論やアルゴリズムを深く理解したうえで、相手に伝える力が不可欠になります。特に統計学はよく議論されるテーマなので、噛み砕いて説明できるだけの知識とスキルが必要になると思います。
▼ 仕事に対する考え(想いやこだわり)
知識の豊富さももちろん大切ですが、指示を待つだけでなく、自分で考えて積極的に動いていく力が最も重要だと感じています。
一人ひとりの主体的な雰囲気が広がっていくことで、事業としてもチームとしても良いものになっていくのだと思います。
入社のきっかけとしてKaggleを紹介したように、DeNAには優秀な技術者が多数在籍しています。加えて、自社でサービスを開発・提供していますから、
自由に扱えるデータが豊富にあり、PoC(Proof of Concept、企画や構想の実現可能性を検証すること、実証実験)やサービスインにもスピード感があります。
このように、実サービスへの距離が近く「打てば響く」恵まれた環境でもあるため、自らの積極的な活動が事業価値につながる実感も得られています。