AI とデータ サイエンスは、コンピューター サイエンスとエンジニアリングの分野におけるトレンドであり、変革をもたらすトピックとして知られています。 AI およびデータ サイエンスの専門家に対する需要は、ヘルスケア、金融、マーケティング、教育、その他の学際的な分野で増え続けています。
人工知能 (AI) とデータ サイエンスは、さまざまな業界を変革しつつある急速に成長している 2 つの分野です。どちらの分野も大量のデータを扱う必要がありますが、その目標とアプローチは異なります。この記事では、AI とデータ サイエンスの基本を探り、専門知識と職務経歴の観点からそれらの類似点、相違点、相互関係に焦点を当てます。
「AI」という用語は 1956 年に作られ、人間の知能を機械でシミュレートすることを目的とした幅広い技術を含みます。 AI システムを構築するには、膨大な量の知識を特定、取得、保存、処理する必要があります。一方、「データ サイエンス」という用語は 20 世紀後半に登場し、大規模なデータセットから貴重な情報を抽出するためのモデルと技術を構築することが含まれます。データ サイエンティストは、統計分析、仮説検証、パターン識別を活用して、統計ツールや機械学習ツールを適用する前に、複雑なシステムの背後にある科学を理解します。
統計学者は長年にわたり、天気、市場、健康、ビジネスなどの分野での予測分析に回帰、分類、クラスタリングなどの機械学習アルゴリズムを採用してきました。ただし、当時利用可能なデータと計算能力が限られていたため、これらの分析の範囲は限られていました。近年、デジタル データと高性能コンピューティング機能 (マルチコア CPU、GPU、膨大な RAM など) の急増により、データ サイエンティストは高度なマシンを使用して、より高速で信頼性が高く、より正確な予測および決定的なシステムを構築できるようになりました。学習モデル。
デジタル データの可用性、高いコンピューティング能力、ビッグ データ上の機械学習モデルの優れたパフォーマンスにより、AI 開発者は、明示的にパターンを識別したり、ルールを形成したり、曖昧さを処理したりする必要のない学習モデルを作成するようになりました。文脈に沿った知識。代わりに、システムは大規模なデータセットでトレーニングされた機械学習モデルを通じて独自に学習します。この自己学習のたとえは、幼児が繰り返しのパターンを観察したり聞いたりすることで学習する方法とよく比較されます。
対照的に、データ サイエンティストは仮説を立て、分析用のデータを収集、整理、構造化し、上層部からの質問に答えて組織が情報に基づいた意思決定を行えるように支援するためのアルゴリズムとモデルを開発します。 AI システム開発者とデータ サイエンティストはどちらも、インテリジェント システムの構築や大規模なデータセットに埋め込まれた情報の抽出に貢献し、2 つの分野間のギャップを埋めています。
私の観点からすると、データ サイエンスで使用されるツールとテクニックは AI システムの開発をサポートし、これらの AI システムはデータ サイエンスの意思決定を支援します。しかし、私たちの批判的思考能力、革新性、望ましい目標を達成するための情熱により、どちらの分野でも人間の関与が依然として重要です。
熟練した AI およびデータ サイエンスの専門家に対する需要は、雇用市場において明らかです。 Microsoft、Google、Amazon、Apple、Nvidia、Uber、Cruise などの大手企業だけでなく、Numerator、Databricks、Unified、Teradata、Algorithmia などの新興企業も、状況に応じて大規模または小規模のデータ サイエンス チームを抱えています。組織の規模。大企業のほとんどには、AI プロダクト マネージャー、AI 倫理学者、ロボティクス エンジニア、AI コンサルタントなどの AI に関する仕事もあります。多くの企業では、これらのチームが緊密に連携して完全なシステムを構築しています。
たとえば、自動運転車を開発している企業は、自動車が周囲の環境を独立して認識、理解、移動できるようにする人工知能システムを設計および実装する AI 専門家のチームを雇用しています。さらに、機械学習モデルを使用してセンサーから収集したデータを改良および分析するデータ サイエンティストのチームがおり、システム全体の安全性と信頼性を確保しています。
私はこれまでのキャリアを通じて、機械翻訳システムを含むいくつかの AI プロジェクトに取り組む機会がありました。 1994 年にカンプール工科大学で私たちは、英語からヒンディー語への翻訳を目的とした、AnglaBharti システムと呼ばれるプロジェクトに取り組みました。このルールベースのシステムには、英語-ヒンディー語辞書をゼロから作成し、英語の文をフレーズ (名詞フレーズ、動詞フレーズ、準備フレーズなど) に解析するためのルールを形成し、解析された構造をヒンディー語に従って変換することが含まれます。ヒンディー語バージョンの文を生成します。
Untuk membangunkan semua modul ini, kami mempunyai pasukan yang terdiri daripada pakar bahasa Hindi dan Inggeris, pengendali kemasukan data, pakar AI, pengaturcara dengan pengetahuan bahasa AI, ahli akademik kanan dan penyelidik AI. Matlamat awal adalah untuk membangunkan sistem terjemahan umum daripada bahasa Inggeris ke Hindi, tetapi akhirnya, kami hanya dapat mencipta sistem yang boleh digunakan untuk domain perubatan.
Namun, selepas 2010, penyelidik dapat membangunkan sistem terjemahan berkualiti tinggi menggunakan LLM tanpa perlu memahami selok-belok bahasa atau proses terjemahan secara terperinci.
Memandangkan AI menumpukan pada pembelajaran dan Sains Data bertujuan untuk mengekstrak pengetahuan daripada data sedia ada, kita boleh menyimpulkan bahawa AI dan Sains Data adalah dua cabang yang berbeza, namun ia kelihatan seperti dua sisi syiling yang sama.
以上がAI とデータ サイエンス: 表裏の関係の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。