160 億のパラメータ、複数の新機能、Fudan MOSS はオープンソースです-AI-php.cn

ホームページ

テクノロジー周辺機器

160 億のパラメータ、複数の新機能、Fudan MOSS はオープンソースです

PHPz

May 01, 2023 pm 10:34 PM

オープンソースフダン

今年 2 月、Machine Heart は、復旦大学が ChatGPT の中国語版をリリースしたというニュースを報じました (「復旦大学が ChatGPT の中国語版をリリース: MOSS がテストを開始し、ホットな検索にヒットし、サーバーが混雑している」を参照)。広く注目を集めました。その時、Qiu Xipeng 教授は、Moss は 4 月にオープンソース化されるだろうと述べていました。

昨日、Moss のオープンソースバージョンが実際に登場しました。

160 億のパラメータ、複数の新機能、Fudan MOSS はオープンソースです

プロジェクトアドレス: https://github.com/OpenLMLab/MOSS

# #MOSS は、中国語と英語のバイリンガリズムと複数のプラグインをサポートするオープンソースの会話言語モデルですが、パラメーターの数は ChatGPT よりもはるかに少ないです。 v0.0.2 の後、チームは調整を続け、現在のオープンソースバージョンである MOSS v0.0.3 をリリースしました。以前のバージョンと比較して、機能も多くの点でアップデートされています。

初期テストでは、MOSS の基本機能は ChatGPT と同様で、テキスト生成、テキスト要約など、ユーザーが入力した指示に従ってさまざまな自然言語処理タスクを実行できます。、翻訳、コード生成、雑談など。

オープンベータの後、チームは中国語コーパスの事前トレーニングを増やし続けました。「これまでのところ、MOSS 003 の基本言語モデルは 100B の中国語トークンでトレーニングされています。合計トレーニングトークンの数は 700B に達し、それには約 300B のコードも含まれていました。」

オープンベータの後、いくつかのユーザーデータも収集しました。実際の中国世界におけるユーザーの意図は次のとおりであることがわかりました。 OpenAI InstructGPT の論文で開示されているように、ユーザーによるシードのプロンプト配布により、よりきめ細かい有用性データとより広範な無害性データをカバーする約 110 万の通常の会話データが再生成されました。

コンテンツソース: https://www.zhihu.com/question/596908242/answer/2994534005

現在、チーム moss-moon-003-base、moss-moon-003-sft、moss-moon-003-sft-plugin の 3 つのモデルが HuggingFace にアップロードされました。将来的には、さらに 3 つのモデルがオープンソースになる予定です。

160 億のパラメータ、複数の新機能、Fudan MOSS はオープンソースです

プロジェクトのホームページによると、moss-moon シリーズのモデルには 160 億のパラメータがあり、A100/A800 の 1 枚または 2 枚のシートで使用できます。 FP16 精度で 3090 グラフィックスカードを実行中、単一の 3090 グラフィックスカードで INT4/8 精度で実行できます。

チームはまた、モデルパラメータの数と自己回帰生成パラダイムが原因で、MOSS は依然として事実誤認を含む誤解を招く返信や、偏見/差別を含む有害なコンテンツを生成する可能性があると述べました。 MOSS によって生成されたコンテンツの特定と使用には注意し、MOSS によって生成された有害なコンテンツをインターネットに拡散しないでください。

新機能

MOSS v0.0.3 では、チームは多数の新機能を追加しました。

チームは、検索エンジン、ヴィンセント図、計算機、方程式ソルバーなどを含む、約 300,000 のプラグインで強化された会話データを構築しました。プラグイン版MOSSの利用方法については、後続チームがGitHub上で発表する予定です。

160 億のパラメータ、複数の新機能、Fudan MOSS はオープンソースです

MOSS v0.0.3 では、複数のプラグインを使用する機能が導入されました。

次の図は、検索エンジンを呼び出す機能を示しています。

160 億のパラメータ、複数の新機能、Fudan MOSS はオープンソースです

次の図は、方程式ソルバーを呼び出す機能を示しています:

160 億のパラメータ、複数の新機能、Fudan MOSS はオープンソースです

次の画像は、テキストから画像を生成する機能を示しています:

160 億のパラメータ、複数の新機能、Fudan MOSS はオープンソースです

プロジェクト著者の Sun Tianxiang 氏は、プラグインのアクティベーションをサポートする MOSS 003 の機能は、gpt-3.5-turbo のシステムプロンプトと同様のメタ命令によって制御されると付け加えました。「モデルによって制御されているため、100％の制御率を保証することはできません。また、複数選択されたプラグインが不正確に呼び出されたり、プラグイン同士が競合するなどのいくつかの欠陥がまだあります。今後、新しいモデルを開発中です」これらの問題をできるだけ軽減するために。」

ダウンロードとインストール

このウェアハウスの内容をローカル/リモートサーバーにダウンロードします:

git clone https://github.com/OpenLMLab/MOSS.gitcd MOSS

conda 環境の作成:

conda create --name moss pythnotallow=3.8
conda activate moss

インストールの依存関係:

pip install -r requirements.txt

トーチとトランスフォーマーのバージョンを、推奨バージョン。

契約によれば、オープンソース MOSS は商業目的で使用できます。

160 億のパラメータ、複数の新機能、Fudan MOSS はオープンソースです

さらに、 , 開発者は、API を介して MOSS サービスを呼び出すことができます。チームは、現在のサービスのプレッシャーに応じて、API インターフェイスを介してサービスを提供することを検討します。インターフェイスの形式については、https://github.com/OpenLMLab/MOSS/blob/main を参照してください。 /moss_api.pdf

現在、VideoChat によるビデオ Q&A などのオープンソースコンテンツに基づいて開発者が作成しています。

VideoChat は、動作認識、ビジュアル字幕、StableLM の機能を組み合わせた多機能ビデオ質疑応答ツールです。このツールは、ビデオ内のあらゆるオブジェクトやアクションに対して高密度で説明的な字幕を生成し、さまざまなユーザーの好みに合わせてさまざまな言語スタイルを提供します。ユーザーがさまざまな長さ、雰囲気、言語の信頼性で会話できるようにサポートします。

160 億のパラメータ、複数の新機能、Fudan MOSS はオープンソースです

プロジェクトアドレス: https://github.com/OpenGVLab/Ask-Anything/tree/main/video_chat_with_MOSS

以上が160 億のパラメータ、複数の新機能、Fudan MOSS はオープンソースですの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

あなたは無知のベールの後ろに職場AIを構築する必要がありますApr 29, 2025 am 11:15 AM

ジョン・ロールズの独創的な1971年の著書「正義の理論」で、彼は私たちが今日のAIデザインの核となり、意思決定を使用するべきであるという思考実験を提案しました：無知のベール。この哲学は、公平性を理解するための簡単なツールを提供し、リーダーがこの理解を使用してAIを公平に設計および実装するための青写真を提供します。あなたが新しい社会のルールを作っていると想像してください。しかし、前提があります。この社会でどのような役割を果たすかは事前にわかりません。過半数または限界少数派に属している、金持ちまたは貧弱、健康、または障害者になることがあります。この「無知のベール」の下で活動することで、ルールメーカーが自分自身に利益をもたらす決定を下すことができません。それどころか、人々はより公衆を策定する意欲があります

決定、決定…実用的な応用AIの次のステップApr 29, 2025 am 11:14 AM

ロボットプロセスオートメーション（RPA）を専門とする多くの企業は、繰り返しタスクを自動化するためのボットを提供しています。一方、プロセスマイニング、オーケストレーション、インテリジェントドキュメント処理スペシャル

エージェントが来ています - 私たちがAIパートナーの隣ですることについてもっとApr 29, 2025 am 11:13 AM

AIの未来は、単純な単語の予測と会話シミュレーションを超えて動いています。 AIエージェントは出現しており、独立したアクションとタスクの完了が可能です。このシフトは、AnthropicのClaudeのようなツールですでに明らかです。 AIエージェント：研究a

共感がAI主導の未来におけるリーダーのコントロールよりも重要である理由Apr 29, 2025 am 11:12 AM

急速な技術の進歩は、仕事の未来に関する将来の見通しの視点を必要とします。 AIが単なる生産性向上を超えて、私たちの社会構造の形成を開始するとどうなりますか？ Topher McDougalの今後の本、Gaia Wakes：

製品分類のためのAI：マシンは税法を習得できますか？Apr 29, 2025 am 11:11 AM

多くの場合、Harmonized System（HS）などのシステムからの「HS 8471.30」などの複雑なコードを含む製品分類は、国際貿易と国内販売に不可欠です。これらのコードは、すべてのINVに影響を与える正しい税申請を保証します

データセンターの要求は、気候技術のリバウンドを引き起こす可能性がありますか？Apr 29, 2025 am 11:10 AM

データセンターと気候技術投資におけるエネルギー消費の将来この記事では、AIが推進するデータセンターのエネルギー消費の急増と気候変動への影響を調査し、この課題に対処するための革新的なソリューションと政策の推奨事項を分析します。エネルギー需要の課題：大規模で超大規模なデータセンターは、数十万の普通の北米の家族の合計に匹敵する巨大な力を消費し、新たなAIの超大規模なセンターは、これよりも数十倍の力を消費します。 2024年の最初の8か月で、Microsoft、Meta、Google、Amazonは、AIデータセンターの建設と運用に約1,250億米ドルを投資しました（JP Morgan、2024）（表1）。エネルギー需要の成長は、挑戦と機会の両方です。カナリアメディアによると、迫り来る電気

AIとハリウッドの次の黄金時代Apr 29, 2025 am 11:09 AM

生成AIは、映画とテレビの制作に革命をもたらしています。 LumaのRay 2モデル、滑走路のGen-4、OpenaiのSora、GoogleのVEO、その他の新しいモデルは、前例のない速度で生成されたビデオの品質を向上させています。これらのモデルは、複雑な特殊効果と現実的なシーンを簡単に作成できます。短いビデオクリップやカメラ認知モーション効果も達成されています。これらのツールの操作と一貫性を改善する必要がありますが、進歩の速度は驚くべきものです。生成ビデオは独立した媒体になりつつあります。アニメーション制作が得意なモデルもあれば、実写画像が得意なモデルもあります。 AdobeのFireflyとMoonvalleyのMAであることは注目に値します

ChatGptはゆっくりとAIの最大のYES-MANになりますか？Apr 29, 2025 am 11:08 AM

ChatGptユーザーエクスペリエンスは低下します：それはモデルの劣化ですか、それともユーザーの期待ですか？最近、多数のCHATGPT有料ユーザーがパフォーマンスの劣化について不満を述べています。ユーザーは、モデルへの応答が遅く、答えが短い、助けの欠如、さらに多くの幻覚を報告しました。一部のユーザーは、ソーシャルメディアに不満を表明し、ChatGptは「お世辞になりすぎて」、重要なフィードバックを提供するのではなく、ユーザービューを検証する傾向があることを指摘しています。これは、ユーザーエクスペリエンスに影響を与えるだけでなく、生産性の低下やコンピューティングリソースの無駄など、企業の顧客に実際の損失をもたらします。パフォーマンスの劣化の証拠多くのユーザーは、特にGPT-4などの古いモデル（今月末にサービスから廃止される）で、ChatGPTパフォーマンスの大幅な分解を報告しています。これ

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーションサーバーと統合します。

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

SecLists

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。