MLP に代わる KAN は、オープンソースプロジェクトによって畳み込みまで拡張されました-AI-php.cn

ホームページ

テクノロジー周辺機器

MLP に代わる KAN は、オープンソースプロジェクトによって畳み込みまで拡張されました

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 01, 2024 pm 10:03 PM

モデル定理

今月初め、MIT やその他の機関の研究者らは、MLP に代わる非常に有望な代替案である KAN を提案しました。

KAN は、精度と解釈可能性の点で MLP を上回ります。また、非常に少数のパラメーターを使用して、多数のパラメーターを使用して実行する MLP よりも優れたパフォーマンスを発揮できます。たとえば、著者らは、KAN を使用して、より小規模なネットワークと高度な自動化で DeepMind の結果を再現したと述べています。具体的には、DeepMind の MLP には約 300,000 個のパラメーターがありますが、KAN には約 200 個のパラメーターしかありません。

KAN は普遍近似定理に基づく MLP と同じ強力な数学的基盤を持っていますが、KAN はコルモゴロフ-アーノルド表現定理に基づいています。

以下の図に示すように、KAN はエッジに活性化関数を持ちますが、MLP はノードに活性化関数を持ちます。 KAN は MLP よりもパラメータ効率が高いように見えますが、各 KAN 層には MLP 層よりも多くのパラメータがあります。写真：【図1：模式図】簡単な説明: KAN はエッジベースのニューラルネットワーク構造であり、各ノードにはエッジの重みと活性化関数があります。エッジ伝播による情報の送信と更新を実現します。 MLP はノードベースのニューラルネットワーク構造であり、各ノードには入力

MLP に代わる KAN は、オープンソースプロジェクトによって畳み込みまで拡張されました

最近、一部の研究者は、KAN の革新的なフレームワークの概念を畳み込みニューラルネットワークに拡張し、畳み込みの古典的な線形変換を変換しました。各ピクセルの学習可能な非線形活性化関数である KAN 畳み込み (CKAN) が提案され、オープンソース化されています。

MLP に代わる KAN は、オープンソースプロジェクトによって畳み込みまで拡張されました

プロジェクトアドレス: https://github.com/AntonioTepsich/Convolutional-KANs

KAN畳み込み

KAN+畳み込みは畳み込みと非常によく似ていますが、カーネルとイメージでは異なります。対応するピクセル間のドット積を適用すると、学習可能な非線形活性化関数が各要素に適用されて合計されます。 KAN+畳み込みのカーネルは、4 つの入力ニューロンと 1 つの出力ニューロンを備えた KAN+ 線形層と同等です。各入力 i に対して、学習可能な関数 ϕ_i を適用すると、この畳み込みステップの結果のピクセルは ϕ_i (x_i) の合計になります。

MLP に代わる KAN は、オープンソースプロジェクトによって畳み込みまで拡張されました

KAN 畳み込みにおけるパラメータ

KxK カーネルがあると仮定すると、この行列の各要素に対して、パラメータ数が Gridsize + 1 である ϕ があり、ϕ は次のように定義されます。

MLP に代わる KAN は、オープンソースプロジェクトによって畳み込みまで拡張されました

これにより、活性化関数 b の表現性が向上し、線形層のパラメーター数は Gridsize + 2 になります。したがって、KAN 畳み込みには合計 K^2(グリッドサイズ + 2) のパラメーターがありますが、通常の畳み込みには K^2 しかありません。

初期評価

著者がテストしたさまざまなアーキテクチャは次のとおりです:

KAN線形層に接続されたKAN畳み込み層(KKAN)
MLPに接続されたKAN畳み込み層(CKAN)
畳み込み間のバッチ正規化を備えた CKAN (CKAN_BN)
ConvNet (MLP に接続された古典的な畳み込み) (ConvNet)
単純な MLP

MLP に代わる KAN は、オープンソースプロジェクトによって畳み込みまで拡張されました

KAN 畳み込みの実装について述べていますまだ初期段階ではありますが、有望なアイデアです。彼らは、KAN 畳み込みのパフォーマンスを評価するためにいくつかの予備実験を実施しました。

これらの「暫定」結果を公開する理由は、このアイデアをできるだけ早く外の世界に紹介し、コミュニティでのより広範な研究を促進したいと考えているためであることは注目に値します。

MLP に代わる KAN は、オープンソースプロジェクトによって畳み込みまで拡張されました

畳み込み層のリストの各要素には、畳み込み数と対応するカーネルサイズが含まれています。

28x28 MNIST データセットに基づくと、KANConv および MLP モデルが ConvNet (大規模) と比較して許容可能な精度を達成していることがわかります。ただし、KANConv と MLP では標準の ConvNet の 7 倍のパラメータが必要になるという違いがあります。さらに、KKAN の精度は ConvNet Medium より 0.04 低く、パラメータ数 (94k 対 157k) は ConvNet Medium のほぼ半分であり、このアーキテクチャの可能性を示しています。これについて結論を出すには、より多くのデータセットで実験を行う必要もあります。

今後数日から数週間で、著者らは、比較に使用されるモデルとモデルのハイパーパラメータも徹底的に調整します。いくつかのハイパーパラメータとアーキテクチャのバリエーションが試みられていますが、これは単なるヒューリスティックであり、正確なアプローチには従っていません。彼らは、計算能力と時間の制約のため、大規模またはより複雑なデータセットをまだ扱っておらず、この問題の解決に取り組んでいます。

今後、著者はより複雑なデータセットで実験を行う予定です。これは、より多くの KAN 畳み込み層を実装する必要があるため、KANS のパラメータ量が増加することを意味します。

結論

現時点では、従来の畳み込みネットワークと比較して、著者は KAN 畳み込みネットワークのパフォーマンスの大幅な向上は見られないと述べました。彼らの分析では、これは、試した最良のアーキテクチャ (ConvNet Big、この比較はスケール係数に基づいて不公平です) を使用しているためであると考えられており、このアーキテクチャの利点は、優れた制御が可能であることです。要件ははるかに少なくなります。

2 つの同一の畳み込み層と、同じ MLP が最後に接続された KAN 畳み込み層を比較すると、古典的な手法の方が精度が 0.06 増加してわずかに優れているのに対し、KAN 畳み込み層と KAN 線形のパラメータの数は、レイヤーは従来の方法のほぼ半分ですが、精度は 0.04 低下します。

著者は、モデルとデータセットの複雑さが増すにつれて、KAN 畳み込みネットワークのパフォーマンスが向上するはずだと述べています。同時に、入力次元が増加するにつれて、モデルのパラメーターの数もより速く増加します。

以上がMLP に代わる KAN は、オープンソースプロジェクトによって畳み込みまで拡張されましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

AIセラピストがここにいます：あなたが知る必要がある14の画期的なメンタルヘルスツールApr 30, 2025 am 11:17 AM

訓練を受けたセラピストの人間のつながりと直観を提供することはできませんが、多くの人々は、比較的顔のない匿名のAIボットと心配や懸念を共有することを快適に共有していることが研究で示されています。これが常に良いかどうか

食料品の通路にAIを呼びますApr 30, 2025 am 11:16 AM

数十年の技術である人工知能（AI）は、食品小売業界に革命をもたらしています。大規模な効率性の向上とコスト削減から、さまざまなビジネス機能にわたる合理化されたプロセスまで、AIの影響はUndeniablです

あなたの精神を持ち上げるために生成的なAIからPEPの話をするApr 30, 2025 am 11:15 AM

それについて話しましょう。革新的なAIブレークスルーのこの分析は、さまざまなインパクトのあるAIの複雑さを特定して説明するなど、最新のAIで進行中のForbes列のカバレッジの一部です（こちらのリンクを参照）。さらに、私のコンプのために

AI駆動のハイパーパーソナリゼーションがすべてのビジネスにとって必須である理由Apr 30, 2025 am 11:14 AM

プロの画像を維持するには、時折ワードローブの更新が必要です。オンラインショッピングは便利ですが、対面の試練の確実性がありません。私の解決策？ AI駆動のパーソナライズ。衣類の選択をキュレーションするAIアシスタントが想像しています

Duolingoを忘れてください：Google Translateの新しいAI機能は言語を教えていますApr 30, 2025 am 11:13 AM

Google Translateは言語学習機能を追加します Android Authorityによると、App Expert AssemberBugは、Google Translateアプリの最新バージョンには、パーソナライズされたアクティビティを通じてユーザーが言語スキルを向上させるように設計された新しい「実践」モードのテストコードが含まれていることを発見しました。この機能は現在、ユーザーには見えませんが、AssembleDebugはそれを部分的にアクティブにして、新しいユーザーインターフェイス要素の一部を表示できます。アクティブ化すると、この機能は、「ベータ」バッジでマークされた画面の下部に新しい卒業キャップアイコンを追加し、「実践」機能が最初に実験形式でリリースされることを示します。関連するポップアッププロンプトは、「あなたのために調整されたアクティビティを練習してください！」を示しています。つまり、Googleがカスタマイズされたことを意味します

彼らはAIのためにTCP/IPを作成しており、Nandaと呼ばれていますApr 30, 2025 am 11:12 AM

MITの研究者は、AIエージェント向けに設計された画期的なWebプロトコルであるNandaを開発しています。ネットワークエージェントと分散型AIの略であるNandaは、インターネット機能を追加することにより、人類のモデルコンテキストプロトコル（MCP）に基づいて構築され、AI Agenを可能にします

プロンプト：Deepfake Detectionは活況を呈しているビジネスですApr 30, 2025 am 11:11 AM

メタの最新のベンチャー：chatgptに匹敵するAIアプリ Facebook、Instagram、WhatsApp、およびThreadsの親会社であるMetaは、新しいAIを搭載したアプリケーションを立ち上げています。このスタンドアロンアプリであるMeta AIは、OpenaiのChatGptと直接競争することを目指しています。レバー

ビジネスリーダーのためのAIサイバーセキュリティでの次の2年間Apr 30, 2025 am 11:10 AM

AIサイバー攻撃の上昇する潮をナビゲートします最近、人類のためのCISOであるジェイソン・クリントンは、機械間通信が増殖すると、これらの「アイデンティティ」を保護するために、非人間のアイデンティティに結びついた新たなリスクを強調しました。

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コードプロンプト機能はサポートされていません

PhpStorm Mac バージョン

最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

SecLists

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。