ホームページ > 記事 > テクノロジー周辺機器 > デジタル インテリジェンス ビジネス分野は、意思決定インテリジェンス テクノロジーの課題にどのように対応しているのでしょうか? 3 人の専門家からの回答
近年、広告主のニーズの変化や関連技術の発展に伴い、広告オークションの仕組みや配信戦略に計算経済理論やゲーム理論、人工知能技術が応用されるケースが増えています。
ビジネス シナリオにおける意思決定インテリジェンスの重要性は、徐々に顕著になってきています。ユーザーが目にするすべての製品表示、販売業者によるすべての広告入札、プラットフォーム上のすべてのトラフィック割り当ては、巨大で複雑な意思決定インテリジェンスによってサポートされています。
これらのアクションの目標は、ユーザーのショッピング体験を最適化し、広告の意思決定プロセスをよりインテリジェントにし、同時に広告主とメディアが長期的な目標を達成できるようにすることです。プラットフォーム上の繁栄。広告主は限られたリソース投資でマーケティング効果を最大化したいと考えており、プラットフォームはより良いエコシステムを構築したいと考えています。しかし、交通環境の複雑さ、他の競合する広告によって形成される競争環境、および広告戦略における入札、ターゲットグループ、リソースの場所、配信時間などの変数の組み合わせの非常に複雑なため、次のような計算と実行が行われます。挑戦に満ちた最適な広告戦略。
これらの問題を解決するにはどうすればよいでしょうか?利益を最大化するという目標はどのように細分化されるのでしょうか?意思決定のインテリジェンスに関連するこれらの重要な問題は、この分野の研究者や実務家にとっても最大の関心事です。
「デジタル インテリジェンス ビジネス シナリオにおける意思決定インテリジェンス」のテーマを深く探求するために、Alimama Boxian Society と Heart of Machines は最近、北京大学の Deng Xiaotie 教授と北京大学の Cai Shaowei を招待しました。中国科学院の研究者とAlimama CTOのZheng Bo氏、この分野の上級学者および専門家3名が、一連のテーマ共有を開始した。
以下は、Deng Xiaotie 教授、Cai Shaowei 研究者、Zheng Bo 教師のテーマ共有コンテンツであり、Heart of the Machine が元の意味を変えずに編集したものです。
今日は、長い歴史を持つ研究分野である計算経済学について簡単に紹介します。 1930年まで。その後の計算経済学は別の観点から始まり、経済学を計算に変えたもので、以前の計算経済学は計算によって経済研究をするというもので、今回はその考え方についてお話します。
経済学を計算の観点から考えると、いくつかの重要な問題があります: 1 つ目は最適化です。機械学習はすべて最適化です。そこから、多くの最適化システムを見ることができます。最適化の次は均衡という問題があって、昔計算経済学をやるときは計画経済の観点からやっていましたが、当時は発展途上国の発展を経済学の視点から取り組む学校もありました。世界銀行は発展途上国のための計画を立て、インプットとアウトプットを最適化するというアイデアを開発しました。計算の観点から均衡を計算することは非常に難しい問題となる可能性があるため、計算可能な一般均衡と呼ばれる概念が登場しました。
最近、世の中には平衡状態にないものが多く、特にデジタル経済活動ではその均衡が顕著なため、よりダイナミックなシステムが見られるようになりました。価格設定などの経済レベルのものも含めて。デジタル経済では、取引データと価格変動が毎秒目に見えます。 1年経過後の経済データをただ数えるのではなく、データの変化がはっきりとわかります。
計算経済学の枠組み全体には、さらに多くのことが含まれています。すべての経済主体は最適化する必要があり、その共同ゲームの固定点は均衡です。プラットフォーム、特にインターネット広告プラットフォームも均衡ゲームを繰り広げ、広告主はプラットフォームにやって来て、プラットフォームやメディアを通じて広告を配信します。メディアにとっては、広告枠を提供し、特定の層に対して自社の魅力を利用する必要がある。プラットフォームに関して考えなければならないのは、どうすれば全員の興味にもっとマッチするかということです。中国最大の広告プラットフォームであるアリママは、ゲームの均衡という問題にも直面しており、社会的利益を最大化し、メカニズム設計の利益を最大化するために、すべての当事者の利益を調整する必要があります。
#最適化については 3 つの観点から説明できます。
最初は、経済的知性の特徴付けの問題です。機械学習の多くは、機械学習メソッドを使用して制約 (一部の環境における制約を含む) を計算する方法など、最適化問題として書かれています。
不完全な情報のもとでは、未知の条件が多く、ゲーム相手の利益関数やゲーム相手の戦略空間など、本来の経済学ではそこまで複雑なことは考慮できません。それは何なのか、ゲームの相手は何なのか、不完全な情報も経済活動を記述する上で非常に重要です。
#多くの仮定は、経済人が相手の利益関数、制約、その他のさまざまな情報を知っているなど、不完全な情報を説明する可能性があります。お互いの利益関数については共通の知識があり、分布については知っています。しかし、この配布はどこから来たのでしょうか?これは私たちを機械学習の領域に導きます。なぜプレーヤーはお互いに、そして私たちに知っていることを伝えるのでしょうか?これらを考慮すると、計算角度に関しては非常に合理的な疑問がいくつかあります。
ゲームダイナミクス、これは計算経済学の 3 番目のステップです。実体経済の経済学の観点から見ると、多くの活動は6000年にわたって進化、発展しており、均衡が得られるまで皆でゆっくりとゲームをプレイします。デジタル経済において、一度に均衡に達することは大きな課題となるでしょう。
広告プラットフォームの最適化は、Alimama が行っていることです。非常に多くの難しいコンピューティング タスクについて話してきましたが、それらをうまく実行できるようになるのはいつになるでしょうか?単一パラメータの場合、既存の理論でそれをサポートできますが、複数パラメータを実現する方法について理論的に既成の定義はありません。
非常に重要な点は、経済学システム全体が確立されているということですが、経済学がインターネット上で使用される場合、大きな欠陥が生じることになります。経済学は静的であるということです。業界の物事は静的なものではないことを誰もが知っておく必要があります。たとえば、「ダブルイレブン」のプロモーションでは多くの課題が生じます。赤い封筒の価格をどのように設計するか、既知の市場モデルに基づいてこれらのものをどのように構築するかが重要な問題となっています。課題: 1 つは近似解の最適化、1 つは均衡計画、もう 1 つはプラットフォームの競争ダイナミクスです。
近似計算は非常に困難です。私たちが知っている平衡解は最大で 3 分の 1 まで計算でき、誤差率は 33% です。これは最適値と 33% 異なるため、平衡計算は確かに困難です。自動設計方法論と隠れた対戦相手モデル学習はこの分野のフレームワークであり、それらはすべて情報容量に関連しています。
マルチパーティの認知のシーケンスにより、ゲームの認知レベルがもたらされます。近年、ファーストプライス オークションがセカンドプライス オークションよりも優れている理由について、いくつかの研究で議論されています。マイヤーソンは、誰もが自分の価値の分布を知っていると仮定して、最適オークションの理論を開発しましたが、実際には私たちは一般の知識を知りません。我々自身の研究を別の視点から考察してみると、アプリオリな共通知識が存在しないことが出発点であり、マイヤーソンの最適オークション理論を確率的手法で確立するという当初の前提は放棄されている。
オークションの均衡に関するこの一連の基本的な仮定が存在しない場合、最適なソリューションはどのようにして均衡を達成できるのでしょうか?一般化されたワンプライス オークションの収益はマイヤーソンと等しいことがわかります。ここで、最適利益を目標として買い手が発表する価値分布を扱う必要があるが、売り手が設計するマイヤーソン最適リターンは、一般化ワンプライスオークションの期待オークションリターンに相当する。
最終的な結論は、Myerson と GFP は同等であり、VCG よりも優れていますが、IID の場合は同等であり、対称 BNE と GSP も同等です。
計算経済学で使用されるもう 1 つの概念はマルコフ ゲームです。これは動的環境におけるゲーム、特に無限ラウンドのゲームを解く問題です。私たちは 3 つの方向からこの問題に取り組みました: 第 1 に、計算を合理的に単純化し、目標を近似解に限定しました。第 2 に、時間割引率を使用して無限ラウンド収入の収束を確実にしました。第 3 に、数学的分析を行いました。ステージの合計により、異なるラウンドでの戦略の変更が 1 つのラウンドでの変更に制限されます。このようにして、無限加算の困難を克服することができます。 マルコフ ゲームの適用における計算の難しさをさらに単純化します。コンセンサスメカニズムの設計には明確なマルコフ報酬分析があり、それは良い物語を語っています。機構設計のルールによれば、多くの人が支持するのが正しい。しかし後に、過半数の支持が経済安全を保証するものではないことが判明した。 私たちの最新の取り組みは、洞察力に富んだマイニング Equilibrium を使用してデジタル経済の設計プロセスの問題を克服し、先見の明のある戦略を使用して、最後に、正直なマイニング プール、利己的なマイニング プールから認知レベルを追加してマルコフ報酬プロセスを形成し、別のレベルを越えてビジョン的なマイニング プールの結果に到達するのがマルコフ ゲームの構造です。 。 同様に、多くのインターネット企業は、静的なものではなく動的なものに対処する必要があります。今日の世界経済は、もはや過去の経済学ではありません。さらに、機械学習の方法論とゲーム理論は、密接に統合されています。このようにして、私たちは静的な経済学にしか対処できない状況を克服し、動的な状況にも対処できるように進化しました。 研究者 Cai Shaowei: 大規模なスパースの組み合わせ最適化問題を解決するための効率的な方法 皆さんこんにちは。今日私が共有するトピックは大きなものです。 -scale スパースの組み合わせ最適化のための効率的な方法。多くの意思決定問題の中核には組み合わせ最適化問題が含まれており、人々は目標の最適化を達成するために適切なソリューションの組み合わせを選択する方法に非常に関心を持っています。 組み合わせ最適化を解く手法には大きく分けて 2 種類あり、1 つはヒューリスティック検索やヒューリスティック構築などのヒューリスティック手法で、例えばよく使われる貪欲アルゴリズムは次のように考えることができます。構築の 1 つのタイプである貪欲基準はヒューリスティックであり、もう 1 つは分枝限定 (ブランド限定) で表される正確なアルゴリズムです。 ヒューリスティック手法の利点は、スケールに敏感ではないため、大規模な問題を近似的に解決できることです。欠点は、得られた結果がどの程度まで得られるかがわからないことが多いことです。解離の最適解は. であるか、最適解を見つけたかもしれませんが、それはわかりません。 Branch And Bound が完了しました。計算して停止するのに十分な時間を与えれば、最適解を見つけて、それが最適解であることを証明できます。ただし、このタイプのアルゴリズムは指数関数的に爆発的に増加し、大規模な問題には適していないことが多いため、この方法にはコストがかかり、規模に敏感です。 検索でも構築でも、ヒューリスティック アルゴリズム フレームワークはほとんどの場合非常にシンプルで、主にヒューリスティックがどのように設計され、どの基準に基づく必要があるかによって決まります。分岐結合法は、主に「境界」をどのように作るかに焦点を当てています。論文を読むと、多くの分岐結合論文が境界技術を行っていることがわかります。境界をより厳しくする方法は、解空間をより適切に刈り込むことができます。 後で考えたのですが、この 2 つを組み合わせることはできるでしょうか?言い換えれば、スケールに影響されないだけでなく、境界テクノロジーを追加することもできます。前処理方法を使用したり、最初にヒューリスティックを実行してから分岐結合を実行し、ヒューリスティックの結果を初期ソリューションとして使用したりできると考えるのは簡単です。私たちは、これに関して新しいアプローチ、ヒューリスティックとブランチアンドバウンドでのネストされた反復を提案します。 簡単に言うと、このメソッドはまず大まかなヒューリスティック解決を実行して、暫定的な結果を見つけます。一般に、境界には上限と下限が必要ですが、ヒューリスティックでは大まかに下限を取得し、上限の関数を設計します。問題が比較的大きく、多くの要素が含まれていると仮定すると、いくつかの要素を削除して問題を小さくすることができます。その後、より洗練されてヒューリスティックな解決を続行すると、下限が改善される可能性があります。これに基づいて、アルゴリズムはさらに制限を加えてネストし続けることができます。したがって、このアルゴリズムは準厳密アルゴリズムとなり、これが最適解であることを証明することができます。これは、特定のステップで問題空間が十分に小さいことが判明し、ヒューリスティックな解決を必要とせずに解決できるためです。直接的かつ正確に。また、最適解が見つからない場合、最適解の区間がどこにあるのかも知ることができます。 # 次に、この方法を 2 つの例を挙げて説明します。 1つ目は「最大群問題」です。クリークはグラフ理論における非常に古典的な概念です。グラフには、点間のエッジで接続された部分グラフがあり、これをクリークと呼びます。最大クリーク問題は、最大のクリークを見つけることです。重みを付けて各頂点に重みを割り当てる場合、最大重み付きクリークの問題は、合計重みが最大のクリークを見つけることです。以下の例では、それぞれ 4 つのグループと 3 つのグループがあり、3 つのグループの重みが大きく、この図では重み付けされたグループの最大値となります。 このフレームワークに従ってこれを行うには、グループ内の FindClique と呼ばれるヒューリスティック解決用の 2 つのサブアルゴリズムが必要です。 ReduceGraph と呼ばれる簡略化アルゴリズムです。 FindClique を使用すると、以前に見つけたクリークよりも優れたクリークを見つけることができます。このより優れたグループが Reduce Graph に到達すると、最大のグループが少なくともこの規模であることがわかります。単純化もこのステップで行われます。単純化後にグラフが空になった場合は、見つかったクラスターが最適解です。空にならない場合は、いくつかの点を減らして、クラスターを見つけるためのアルゴリズムの調整に戻ることができます。ここでのアルゴリズムは必ずしも固定されたアルゴリズムではなく、動的に変化する可能性があります。 私たちの研究の 1 つは、複数の貪欲なアルゴリズムとして理解できる「構築して切り取る」方法を選択しました。 複数の貪欲な構築の効果は、各貪欲な構築が非常に高速であり、異なる開始点から開始できること、および特定の構築中に開始できることです。計算後、現在のグループがいくら拡大しても、以前に見つかったグループを超えることは不可能なので、停止できます。最終的な目標は、以前よりも大きなグループを見つけることです。ヒューリスティックをより洗練する必要があるかどうか、順序をどのように調整するかは、グラフのスケールに依存します。これは、玉ねぎの皮をむくようなものです。特定の層まで皮をむいて、次に、より良いチームを見つけることに重点を置くように調整します。グラフをこれ以上単純化できない場合は、Branch And Bound などの正確なアルゴリズムを使用できます。グループを見つけた後、私たちの方法によれば、境界を設定していくつかの点を破棄する必要があります。この方法では、点が展開できるグループのサイズを推定することになっており、それを解決するにはさまざまな解決策が考えられます。 これら 2 つの境界推定手法は例として使用されており、別の手法を使用して実行することもできます。実験に関しては、FastWClq、LSCC BMS、MaxWClq などの方法を比較するには、以下の表を参照してください。同じ精度を達成するのに必要な時間は、10 倍、さらには数百倍も異なります。 2問目「グラフの色分け問題」を見てみましょう。いわゆる色付けとは、グラフの各点に色を適用することです。隣接する 2 つの点を同じ色にすることはできません。グラフの色付けの問題では、グラフの色付けに使用できる最小色の数について説明します。最小色の数をグラフの色番号といいます。グラフの色付けの問題には、特に競合せずにリソースを割り当てるなど、多くの用途があります。 この問題の一般的な考え方は同じで、ヒューリスティックな解決策にいくつかの境界技術を加えたものです。違いは、グラフの色付け問題にはサブセットが必要ないことです。グラフ全体に色を付ける必要があるため、「永久に捨てる」という概念はありません。各点は最終的に返される必要があり、この点には色。ここでのリデュースは、グラフをカーネルとマージンに分解することです: 非常に単純なルールがあり、それは独立したセットに関連しています。私はこれを知っています。グラフで使用する必要がある色の最小数は色の下限 (ℓ で示されます) であり、その後、ℓ 度の範囲の独立したセットを見つけることができます。この独立集合の点の度数はすべて ℓ より小さいため、ℓ 度限界と呼ばれます。このような独立したセットを見つけた場合は、安全にマージンに移動できます。カーネルの解が見つかったら、それにマージンを簡単にマージすることができます。カーネルが最適解であれば、その組み合わせも最適解でなければなりません。このルールは繰り返し使用できます。 例を見てみましょう。この例の 4 つの灰色の点はカーネルです。少なくとも 4 色が必要であることがわかります。その隣の 3 点はエッジ上に配置されていますが、3 点の次数が 4 より小さいため、これらの 3 点を横に移動して、今のところ無視しても問題ありません。その後、残りの部分グラフは分解できないことがわかりました。これはすでに非常にハードコアであり、直接解決できます。スパース グラフのコアは一般に大きくないため、解決策として正確なアルゴリズムを考慮できます。コアが見つかったら、そのコアは少なくとも 4 つの色を使用していることがわかります。エッジ上の点については、各点の次数は 4 未満です。どのようにして色を残すことができますか?線形で通過するだけです。時間。 。 最後まで、各皮の余白を保持し、層を明確にマークする必要があります。これは最初の質問に関連します。少し違う場所。これらのエッジ マップを保持するには、追加のデータ構造を使用する必要があります。移動できない最後のカーネルが正確に解決された後、逆順序の方法を使用して、最初に最後のマージンをマージし、以前のルールに従って最適性を維持できます。カーネルが最適であれば、エッジのマージは依然として最適ですが、最後まで戻ると、元の画像へのソリューションも最適になるはずです。 この問題が枠組みになったら、あとは下限と上限をどうやって見つけるかを考えるだけです。アルゴリズムの一般的な考え方は次のとおりです: 最初に、カーネルは元の画像であり、下限を見つけるために最大クリーク アルゴリズムを使用する必要があります。エッジを剥がした後、貪欲なグラフ カラーリング アルゴリズムを使用できます。上限を見つけるために。 実際には、ここでは 3 つのアルゴリズムが使用されています。実際には、パンチング手法の組み合わせ、特にカーネル カラーリングを使用するのが一般的です。画像が比較的大きい場合は、貪欲な方法やより高速な方法を使用して、最終的に正確なアルゴリズムを使用することもあります。プロセス全体を通じて、下限と上限はグローバルであり、これら 2 つが等しい場合は停止できます。 #上の写真は実験結果です。全体像に対する効果はより優れており、144 個中 97 個が 1 分間で最適な解決策を証明できます。同様のアルゴリズムと比較して、私たちのアルゴリズムの比較時間も速く、比較的まばらな大きなグラフに対して問題を迅速に解決できる特別なメソッドがあります。人々は、何百万もの頂点を持つ NP 困難問題を解くのに長い時間がかかると考えていましたが、実際、これらのグラフが大きくても特定の特性を備えている場合は、数秒から数分で解くことができます。 Alimama CTO Zheng Bo: 継続的にアップグレードされる Alimama の意思決定インテリジェンス テクノロジー システム 皆さん、こんにちは。Alimama の技術リーダーとして、業界の観点からこれを共有します。アリママは、ここ数年で意思決定インテリジェンス技術において進歩を遂げてきました。 2007 年に設立された Alimama は、オンライン広告部門であるアリババ グループの中核商業化部門です。 10年以上の開発を経て、Alimamaは「検索広告淘宝エクスプレス」などの影響力のある製品を生み出し、2009年にはディスプレイ広告とAd Exchange広告取引プラットフォームを立ち上げ、2014年にはデータ管理プラットフォームDamopanが登場し、グローバルマーケティングを開始しました。 2016年に。 技術的な観点から見ると、2015 年から 2016 年にかけて、Alimama はインテリジェント マーケティング エンジン OCPX から自己調査に至るまで、ディープ ラーニングを全面的に採用しました。 CTR 予測の中核アルゴリズムである MLR モデルは、深層学習手法によって進化し続けています。 2018 年に、深層学習フレームワーク X-Deep Learning がオープンソース化されました。 2019年にはオイラーグラフ学習フレームワークがオープンソース化され、情報フロープロダクトのスーパーレコメンデーションも開始され、「人がモノを見つける」が「モノが人を見つける」へと進化しました。 2020 年から、アリママはライブストリーミング広告を開始し、より頻繁にプレイされるインタラクティブ ゲーム「ダブル イレブン」スタッキング キャットなどのインタラクティブ インセンティブ広告も開始しました。曲率空間学習フレームワークも今年オープンソース化されました。 2022 年に、Alimama は広告エンジン全体に大幅なアップグレードを行いました。広告エンジン プラットフォーム EADS とマルチメディア制作および理解プラットフォーム MDL は両方ともオンラインであり、消費者のプライバシー保護の観点から、Alimama のプライバシー コンピューティング技術能力は中国情報通信技術学院によって認定されています。 Alimama の過去 15 年間の発展を振り返ると、当社がコンピューテーショナル広告に取り組む企業であることがわかります。 Alimama の利点は何ですか?非常に専門的な電子商取引分野では、ユーザーと電子商取引を非常に深く理解しており、ビジネス シナリオも非常に豊富です。従来の検索や推奨に加えて、ライブ ブロードキャストなどのデジタル ビジネス シナリオも備えています。プロモーション、インタラクション、新しい形。さらに、当社の顧客ベースは世界最大規模であり、何百万もの販売業者がアリママのプラットフォームの広告主となっています。これらの顧客は多くのニーズを抱えており、運用に関するビジネスニーズに加え、アンカー、専門家、エージェント、サービスプロバイダーなど、さまざまなエコロジーな役割が関与しており、さまざまな役割でこのプラットフォームで活躍しています。 AI に関する研究も数多くあります。広告シーンのアルゴリズム技術の特徴をご紹介します。上に示したように、左側の逆ファネル構造は、検索や推奨を行う多くの学生にとってよく知られています。広告のこの部分は、広告の想起、大まかな分類、詳細な分類、メカニズム戦略のスコアリングなど、検索の推奨と非常によく似ています。情報検索など大量の AI が関与する技術、特にマッチング TDM などのリコール モデルはすべてディープラーニング技術を使用しています。 これには意思決定インテリジェンスが含まれます。プラットフォームには多くの役割が含まれており、それぞれに独自のゲーム関係があるため、意思決定インテリジェンスは、マルチパーティの関係と最適化されたバランスの間で役立ちます。ユーザー エクスペリエンス、トラフィック コスト、期待される収益、予算管理、クロスドメイン統合はすべてバランスをとる必要があります。 #ここでは、代表的な 3 人のゲームプレイヤーについて説明します。プラットフォームには多くのプレーヤーが存在し、メディア、広告主、広告プラットフォームの 3 つの主要なカテゴリがあります。 これら 3 つの部分のコア テクノロジーは次のように要約できます: メディアの観点からは、ユーザー エクスペリエンスと商業収益のバランスを最も良く取れるメディア リソースをリリースすることに重点を置き、広告主の観点からは、何をどのように最適化する必要があるか最小のマーケティング目標をコストをかけて達成します。では、広告プラットフォームの最大の目標は何でしょうか?長期的には、広告プラットフォームの下位目標はプラットフォーム全体をより繁栄させることであり、お金を稼ぐことは短期的な問題であり、長期的にプラットフォームを繁栄させることが最終的な目標です。プラットフォームはすべての当事者間の関係のバランスをとり、すべての当事者のプレイヤーがプラットフォームでプレイできるようにする必要があります。 広告プラットフォームの最適化目標には、多くのメカニズム設計が含まれます。今日は、スマートオークションのメカニズム設計、スマート入札戦略、スマート商業化戦略の3つの方向性について簡単にお話ししますが、主にこの点に関するアリママの過去数年間の取り組みについて、誰もが議論できるポピュラーサイエンスの手法でお話したいと思います。 #インテリジェントなオークション メカニズムの設計。 # まず、インテリジェント オークション メカニズムの設計について話しましょう。これは非常に興味深いトピックです。多くの高齢者や専門家がノーベル経済学賞を受賞しています。私たちが話している古典的なオークションの仕組みはすべて 1970 年代以前に登場したもので、当時はオンライン広告がまだ登場しておらず、単一オークションや静的オークションの最適化について誰もがよく研究していました。これらのメカニズムは通常、単一ターゲットであり、単一のオークション用です。 広告プラットフォームであれ、メディアであれ、ユーザーエクスペリエンスと広告収入のバランスをとる必要があります。業界の典型的な課題は、多目的の最適化です。多くの企業が関与する場合、そこにはプラットフォーム戦略と意志があり、これも多目的最適化です。 当初から、トラフィックの分散と価格設定には GSP や UGSP などの古典的なオークション理論が使用されていましたが、業界はこの問題を解決するために徐々にディープ ラーニングに進化しました。これらの古典的なアルゴリズムは、プラットフォームが特定の目標に向けて最適化するいくつかのパラメーターを計算するために数式を使用します。深層学習のツールを使用すると、オークションのメカニズムの設計自体も意思決定の問題になります。意思決定の問題を解決するためのアルゴリズムですが、生産意思決定アルゴリズムは意思決定問題でもあります。 3 年前、私たちはディープラーニングをベースとした Deep GSP オークションの仕組みを設計し、その仕組みの良さであるプラットフォームの効果や、このメカニズムのいわゆる善良な性質は、インセンティブと互換性があり、広告主は手抜きや白黒つける方法を使ってお金を稼ぐ必要がなく、自分の希望を真に表現し、入札に見合ったトラフィックを獲得することができます。 Deep GSP は、インセンティブの互換性プロパティを維持し、元の静的な式を学習可能なディープ ネットワークに置き換えます。これが作業の最初の段階です。 第 2 段階では、トレーニングと最適化を通じてオークション メカニズム ネットワーク内の多くのパラメーターを計算しました。しかし実際には、パラメータの計算、並べ替え、広告配信のプロセスに加えて、プロセス全体がシステム全体の不可欠な部分です。ソート モジュールなどの一部のモジュールは実際には微分不可能であるため、深層学習ネットワークでシミュレートすることは困難です。オークション メカニズムをエンドツーエンドで設計するために、オークション プロセスの微分可能な部分を次のようにモデル化します。伝導によりモデルのトレーニングがより便利になります。 # スマートな入札戦略。 最初の古典的なソリューションは最も古い入札方法でもあり、予算がよりスムーズに使用され、効果がより保証されることが期待されています。当初、業界は PID 制御アルゴリズムと同様に、非常に単純なアルゴリズムを採用し、その効果は比較的限定的でした。 2014 年と 2015 年、AlphaGo が人間を破った後、私たちは強化学習の力を目の当たりにしました。スマート入札は、非常に典型的なシーケンスの意思決定問題です。予算サイクル中、前回の支出が良いかどうかは、その後の入札の決定に影響します。これが強化学習の強みであるため、第 2 段階では、次のことに基づいて入札を使用しました。強化学習。MDP モデリングを通じて、強化学習を直接使用してこれを行います。 第 3 段階は SORL プラットフォームに進化しました。SORL プラットフォームは、強化学習におけるオフライン シミュレーション環境とオンライン環境の間の不一致によって特徴付けられます。オンライン環境で直接対話型学習を実施します。これは、エンジニアリング設計とアルゴリズム設計の結合の一例です。 SORL の立ち上げ後、強化学習がシミュレーション プラットフォームに大きく依存するという問題は大幅に解決されました。 その他の技術機能には、スマート入札モデルのトレーニング フレームワーク、統合フローおよびバッチ制御システム、マルチチャネル配信グラフィカル オンライン エンジンなどのエンジニアリング インフラストラクチャ部分が含まれます。エンジニアリング システムとアルゴリズムも同様に重要です。トレーディング センターに近づき、よりリアルタイムになればなるほど、より良いフィードバックを得ることができます。スマート入札の場合、エンジニアリング インフラストラクチャが高度であればあるほど、広告主がより良い目標を達成するのに役立ちます。結果。 #スマートな商品化戦略。 #最後に、メディアに関するインテリジェントな商品化戦略についてお話します。事業化戦略の最適化に関しては、最初の試みは、広告結果と自然結果を重み付けして統合し、それらを混合し、さまざまな状況に応じて選択することでした。不合理な商業化メカニズムはユーザー エクスペリエンスに非常に有害であり、誰もがこの問題に気づき始めています。ここ 1 ~ 2 年で、動的な表示戦略が徐々に普及してきており、ディープ ラーニングやその他のテクノロジーの発展により、意思決定アルゴリズムを最適化することでユーザー エクスペリエンスと商業収益のバランスをとり、ユーザー エクスペリエンスとグローバル トラフィックのバランスをとることができます。 全体として、これら 3 つの主要な側面において、Alimama は意思決定を行うインテリジェント システムの図を作成しました。これは 3 つのレベルに分かれています。 インテリジェント オークションインテリジェントな商業化戦略によって解決される問題は、どのような種類のリソース オークションが最も効率的で、ユーザー エクスペリエンスと商業収益のバランスが最も良くなるかということです。インテリジェントな入札戦略は、洗練された入札のための意思決定プロセスです。入札パラメータの最適化、実際の環境に基づく強化学習パラメータの最適化、または目標 CPX や最大リターンなどのモデリング パラダイムを使用した最適化を通じて。 現在の複数ラウンドオークションと高頻度オークションに直面すると、多くの基本理論をさらに打ち破る必要があります。基本的なメカニズムの理論的ブレークスルーに関しては、Deng 先生はこの分野の専門家であり、私たちは彼と協力してこの分野で最先端の研究を行うことを楽しみにしています。実際の工学的な問題の課題という観点から見ると、実際の環境では200ミリ秒以内に結果を返す必要があるため、効率と効果のバランスが必要であることは、私も長くこの業界で働いてきて実感しています。 広告エコロジーの最適化は比較的独立しています。プラットフォームの最終目標は、エコロジーが繁栄し、平和的に発展することです。これらがうまくできれば、エコロジーは期待に応えることができますか?両者の間に直接的な等式があるとは思えません。環境の最適化に関しては、解決すべき理論的および実践的な問題がまだ多くありますが、将来的には業界の友人たちが議論し、一緒に解決できることを願っています。 過去 3 年間で、Alimama は意思決定インテリジェンスの分野でトップの国際会議 (NeurIPS、ICML、KDD、WWW など) で 20 本近くの論文を発表してきました。北京大学、上海交通大学、中国科学院、浙江大学、その他多くの大学や研究機関と協力しており、関連する成果は産業界や学界から広く注目され、フォローアップされています。 、業界を追随することから徐々に業界をリードする技術開発を達成しました。 ディープラーニングに比べて、意思決定インテリジェンスは産業界でも学界でもあまり注目されていないので、この機会にこの分野をもっと皆さんに知っていただきたいと思っています。とても興味深くて興味深いです。上記はアリママの考えであり、意思決定インテリジェンスに関する取り組みです。私はそれを産業界や学界の友人たちと共有したいと思っています。将来的にはこれについてさらに議論し、意思決定インテリジェンスと意思決定インテリジェンスに関する理論研究において画期的な発展をもたらすよう努めることができます。業界での実用化。
以上がデジタル インテリジェンス ビジネス分野は、意思決定インテリジェンス テクノロジーの課題にどのように対応しているのでしょうか? 3 人の専門家からの回答の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。