Shapash とは
モデルの解釈可能性と理解可能性は、多くの研究論文やオープンソース プロジェクトの焦点となってきました。そして、多くのプロジェクトにはデータの専門家と訓練を受けた専門家がスタッフとして配置されています。
Shapash は、ほとんどの sklearn、lightgbm、xgboost、catboost モデルで動作し、分類および回帰タスクに使用できます。 Shap バックエンドを利用してフィーチャのローカル寄与を計算しますが、これはローカル寄与を計算するための他の戦略に置き換えることができます。データ サイエンティストは、Shapash インタープリターを活用してモデルの調査とトラブルシューティングを行ったり、それを導入して各推論を視覚化したりできます。また、エンド顧客や起業家に多大な価値をもたらす Web アプリケーションの作成にも使用できます。
shabash ライブラリ
Shapash の目標
1. 明確で妥当な結果を表示します
プロットと出力では、各コンポーネントのタグとそのパターン:
2. Web アプリケーション
データ サイエンティストは、Web アプリケーションを使用して、グローバルとローカルの近傍を簡単に探索して、モデルを理解し、さまざまなキーポイントがどのように機能するかを理解します:
shapash ライブラリ Webapp
3. 概要とエクスポートの説明
Shapash は、短くてわかりやすい説明。 Shapash の機能が要約され、明確に説明されているため、バックグラウンドに関係なく、すべての顧客がホスティング モデルの明確な説明を理解できます。
4. 完全なデータ サイエンス レポート
完全なデータ レポートは、こちらでご覧いただけます: https://shapash-demo.ossbymaif.fr/
Shapash の機能
Shapash のいくつかの機能は次のとおりです。
1. 機械学習モデル: 分類 (バイナリまたはマルチクラスの問題) および回帰問題に適しています。 Catboost、Xgboost、LightGBM、Sklearn Ensemble、線形モデル、SVM などの複数のモデルをサポートします。
2. 特徴エンコーディング: ワンホット エンコーディング、順序エンコーディング、Base N エンコーディング、ターゲット エンコーディング、バイナリ エンコーディングなど、データ セット内のカテゴリ特徴を処理するための多数のエンコーディング手法をサポートしています。
3.SklearnColumnTransformer: OneHotEncoder、OrdinalEncoder、StandardScaler、QuantileTransformer または PowerTransformer
4.視覚化: 結果を簡単に説明し、理解しやすく明確な結果を表示する一連の視覚効果を提供します。
5. ライムやシャップと互換性があります。 Shap バックエンドを使用して、わずか数行のコードで結果を表示します。
6. 結果を簡潔に取得するためのパラメータのオプションが多数用意されています。
7.Shapash はインストールと使用が簡単です。Shapash は、モデルを理解し、簡単な構文で要約して明確にするための SmartExplainer クラスを提供します。
8. 導入: 運用上の使用状況の調査と導入 (API またはバッチ モード経由) が重要です。グローバルからローカルに移動する Web アプリケーションを簡単に作成します。
9. 高い汎用性: 結果を表示するには多くの引数が必要です。しかし、データのクリーンアップとアーカイブを強化すればするほど、最終顧客にとっての結果はより明確になります。
Shapash の仕組み
Shapash は、機械学習の理解と解釈を容易にする Python ライブラリです。データ愛好家はモデルを簡単に理解して共有できます。 Shapash はバックエンドとして Lime と Shap を使用し、わずか数行のコードで結果を表示します。 Shapash は、妥当な結果を得るために機械学習モデルの構築におけるさまざまな重要な進歩に依存しています。次の図は、shapash パッケージのワークフローを示しています。
Shapash の仕組み
仕組み
- まず、データの準備、特徴量エンジニアリング、モデルのフィッティング、モデルの評価、モデルの理解などの各ステップの要素をコンパイルします。
- 2 番目に、モデルをより深く理解するための WebApp と図が提供されます。モデルの結果はクライアントと共有し、議論することができます。
- 最後に、解釈可能性の概要を示します。
インストール
次のコードを使用して Shapash をインストールできます:
<span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">pip</span> <span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">install</span> <span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">shapash</span>
Jupyter Notebook の場合: Jupyter Notebook を使用していてインライン グラフを表示したい場合は、別のコマンドが必要です:
<span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">pip</span> <span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">install</span> <span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">ipywidgets</span>
はじめに
ここでは、データセット House Price Prediction を使用して Shapash を調べます。これは回帰問題であり、住宅価格を予測する必要があります。まず、一変量分析と二変量分析を含むデータセットを分析し、次に特徴の重要度、特徴の寄与、局所プロットと比較プロットを使用してモデルの解釈可能性を分析し、次にモデルのパフォーマンス、最後に WebApp を分析します。
データセットの分析
一変量分析
使用 以下の画像を表示して、「1 階平方フィート」という名前の要素を理解できます。平均、最大、最小、標準偏差、中央値など、トレーニング データセットとテスト データセットのさまざまな統計を示すテーブルが表示されます。右側の図では、トレーニング データ セットとテスト データ セットの分布プロットが表示されます。 Shapash では、特徴がカテゴリであるか数値であるかについても言及されており、すべての特徴が利用できるドロップダウン オプションも提供されています。
一変量分析
カテゴリ特徴量の場合、トレーニング データセットとテスト データセットには重複しない値と欠損値が表示されます。右側には、各機能の対応するカテゴリの割合を示す棒グラフが表示されます。
機能のカテゴリ
目標分析
販売価格という名前のターゲットの詳細分析も確認できます。変数。左側には、トレーニング データセットと予測データセットの数、平均、標準偏差、最小値、最大値、中央値などのすべての統計情報が表示されます。右側には、トレーニング データセットと予測データセットの分布が表示されます。
多変量分析
一変量分析については上で詳しく説明しました。このセクションでは多変量解析について見ていきます。次の図は、トレーニング データセットとテスト データセットの最初の 20 個の特徴の相関行列を示しています。相関スケールも色別に表示されます。これは、Shapash を使用して特徴間の関係を視覚化する方法です。特徴重要度プロット
このライブラリを使用して合格この機能の重要性がわかります。特徴重要度は、出力値を予測する際の入力特徴の重要性を見つける方法です。次の図は、機能重要度曲線を示しています。機能寄与度プロット
これらの曲線特徴が私の予測にどのように影響するか、その寄与がプラスかマイナスかなどの質問に答えるのに役立ちます。この図は、モデルの解釈可能性の重要性を完全に示しています。モデルの全体的な一貫性により、モデルに対する機能の影響を理解する可能性が高くなります。 数値特徴とカテゴリ特徴の寄与プロットを確認できます。 #数値特徴の場合
寄与グラフ
#分類機能の場合
ローカル マップを描画できます。次の図は、図の一部を示しています。
部分図
比較図
比較図を描くことができます。次の図は比較グラフを示しています。
#WebApp
プロジェクトアドレス: https://github.com/MAIF/shapash
最後に書いてください
この記事ではshapashの基本的な機能と描画表示について簡単に紹介しており、このPythonライブラリについては皆さんもある程度の理解はあると思います。
以上がもう 1 つの機械学習モデル解釈アーティファクト: Shapashの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

自宅で大規模な言語モデルを簡単に実行する:LM Studioユーザーガイド 近年、ソフトウェアとハードウェアの進歩により、パーソナルコンピューターで大きな言語モデル(LLM)を実行することが可能になりました。 LM Studioは、このプロセスを簡単かつ便利にするための優れたツールです。この記事では、LM Studioを使用してLLMをローカルに実行する方法に飛び込み、重要なステップ、潜在的な課題、LLMをローカルに配置することの利点をカバーします。あなたが技術愛好家であろうと、最新のAIテクノロジーに興味があるかどうかにかかわらず、このガイドは貴重な洞察と実用的なヒントを提供します。始めましょう! 概要 LLMをローカルに実行するための基本的な要件を理解してください。 コンピューターにLM Studiをセットアップします

Guy Periは、McCormickの最高情報およびデジタルオフィサーです。彼の役割からわずか7か月後ですが、ペリは同社のデジタル能力の包括的な変革を急速に進めています。データと分析に焦点を当てている彼のキャリアに焦点が当てられています

導入 人工知能(AI)は、言葉だけでなく感情も理解し、人間のタッチで反応するように進化しています。 この洗練された相互作用は、AIおよび自然言語処理の急速に進む分野で重要です。 th

導入 今日のデータ中心の世界では、競争力と効率の向上を求める企業にとって、高度なAIテクノロジーを活用することが重要です。 さまざまな強力なツールにより、データサイエンティスト、アナリスト、開発者が構築、Deplを作成することができます。

今週のAIの風景は、Openai、Mistral AI、Nvidia、Deepseek、Hugging Faceなどの業界の巨人からの画期的なリリースで爆発しました。 これらの新しいモデルは、TRの進歩によって促進された電力、手頃な価格、アクセシビリティの向上を約束します

しかし、検索機能を提供するだけでなくAIアシスタントとしても機能する同社のAndroidアプリは、ユーザーをデータの盗難、アカウントの買収、および悪意のある攻撃にさらす可能性のある多くのセキュリティ問題に悩まされています。

会議や展示会で何が起こっているのかを見ることができます。エンジニアに何をしているのか尋ねたり、CEOに相談したりできます。 あなたが見ているところはどこでも、物事は猛烈な速度で変化しています。 エンジニア、および非エンジニア 違いは何ですか

Rocketpy:A包括的なガイドでロケット発売をシミュレートします この記事では、強力なPythonライブラリであるRocketpyを使用して、高出力ロケット発売をシミュレートすることをガイドします。 ロケットコンポーネントの定義からシミュラの分析まで、すべてをカバーします


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

Dreamweaver Mac版
ビジュアル Web 開発ツール

WebStorm Mac版
便利なJavaScript開発ツール

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境
