老闆們正在尋找特定的技能組合、專業知識和工作流程,而這些技能與平台無關。
下圖顯示了20種需求技能,包括NLP基礎知識和更廣泛的資料科學專業知識。
自然語言處理基礎(NLP)
如圖表所示,老闆最重視的NLP技能是NLP基礎知識。與去年相比,雇主對具有數據分析技能的人需求激增。
這意味著我們不能只是了解平台,而要了解NLP是如何作為核心技能運作的。如果你不知道如何應用Transformer、分類、語言學、問題回答、情緒分析、主題建模、機器翻譯、語音辨識、命名實體辨識等核心NLP技能,那麼知道光是知道spaCy如何運作,也沒有意義。
機器學習與深度學習
#機器學習是基本的資料科學技能,而深度學習是NLP的基礎。
掌握這兩者將證明您了解資料科學,進而了解NLP。因為雇主大多希望人才可以使用預訓練模型和Transformer。
研究
NLP需要與最新的論文和模型保持同步。公司發現NLP是AI的最佳應用之一,無論是什麼行業的公司都是如此。
因此,了解或找到正確的模型、工具和框架來應用於 NLP 的許多不同用例,這需要一個強大的研究重心。
資料科學基礎
#在了解機器學習這項核心技能後,了解程式設計與電腦科學基礎知識,會顯示你在該領域有堅實的基礎。電腦科學、數學、統計學、程式設計和軟體開發都是NLP專案中所需的技能。
雲端運算、API 和資料工程
#NLP專家不會直接在他們的個人筆記型電腦上進行情感分析。雇主們正在尋找能夠處理更多資料工程全端的NLP專家,像是能夠使用API,建立資料管道,建立工作流程管理,並在基於雲端的平台上完成這一切的人才。
NLP平台和工具
除了技能和專業知識之外,還有一些特定的平台、工具和語言是老闆們特別看重的。下面的圖表顯示了現在流行的平台。這份名單並沒有囊括所有平台,所以大家最好是隨時更新、尋找一下流行的新工具和框架。
機學習架構
除了一般的機器學習與深度學習之外,還有一些框架是NLP計畫的核心。
TensorFlow因其在ML和神經網路的靈活性而受到青睞,PyTorch因其在NLP方面的易用性和先天設計而受到歡迎,scikit-learn則廣泛用於分類和聚類。
雖然只知道一個平台已經很厲害了,但透過了解這三個或更多的平台,我們可以變得更靈活,更具適應性,這樣也就會更有競爭力。
與去年相比,PyTorch現在是最受歡迎的機器學習框架,並且已經慢慢超過TensorFlow/Keras,成為ML任務的首選。
自然語言處理框架
為了更具體地了解NLP,這裡有幾個框架,對於想要成為NLP的專業人員很有用。
NLTK因其更廣泛的性質而受到讚賞,因為它能夠為幾乎所有工作提取正確的演算法。
同時,spaCy因其處理多種語言的能力和支持詞向量的能力而受到讚賞。
新加入的是Apache OpenNLP,主要用於常見的NLP任務和簡易操作,CoreNLP用於Java。
令人驚訝的是,有著深度學習架構的HuggingFace transformers並不在去年的名單上。
在過去的幾年裡,BERT仍然非常受歡迎,儘管Google的最後一次更新是在2019年底,但它仍然被廣泛應用。
BERT之所以能夠脫穎而出,是因為其對問答和基於上下文的相似性搜尋有強大親和力,這樣它在聊天機器人以及其他相關應用程式中也能表現得相當可靠。
BERT甚至考慮了單字的上下文,從而可以得到與各個查詢和任務相關的更準確的結果。
資料工程平台
資料管道有助於文字資料的流動,特別是對於即時資料流和基於雲端的應用。而在這個領域,儘管其他平台還在壯大,Spark仍是資料管道的領導者。
它甚至還有一個更具體的版本,Spark NLP。它是一個專門用於語言任務的函式庫。尤其是在醫療保健領域,Spark NLP得到了大量應用——這是一個擁有大量數據的領域,含有許多醫療記錄和醫學數據。
NLP程式語言
Python作為NLP的首選程式語言,一直遙遙領先,這一點應該不出大家所料。
許多流行的NLP框架,如NLTK和spaCy,都是基於Python的,所以成為Python配套語言的專家是很有意義的。
了解一些SQL也是不可或缺的。 Java有許多為該語言設計的函式庫,包括CoreNLP、OpenNLP等。
自然語言處理雲端平台
雲端服務是2022年的常態,所以我們看到一些服務提供者變得越來越受歡迎。
AWS雲、Azure雲和其他都與許多其他框架和語言相容,它們也就因此成為所有NLP技能的必要條件。同時,谷歌雲也開始嶄露頭角。
總的來說,如果你想點亮一個新的技能點,獲得一項稀缺的、永不過時的、廣泛使用的技能,那麼也許現在是時候學習NLP或其他核心資料科學技能了!
以上是幫你卷贏同行! 2023年頂級NLP技能、框架、平台和語言總結的詳細內容。更多資訊請關注PHP中文網其他相關文章!

對於那些可能是我專欄新手的人,我廣泛探討了AI的最新進展,包括體現AI,AI推理,AI中的高科技突破,及時的工程,AI培訓,AI,AI RE RE等主題

歐洲雄心勃勃的AI大陸行動計劃旨在將歐盟確立為人工智能的全球領導者。 一個關鍵要素是建立了AI Gigafactories網絡,每個網絡都有大約100,000個高級AI芯片 - 2倍的自動化合物的四倍

微軟對AI代理申請的統一方法:企業的明顯勝利 微軟最近公告的新AI代理能力清晰而統一的演講給人留下了深刻的印象。 與許多技術公告陷入困境不同

Shopify首席執行官TobiLütke最近的備忘錄大膽地宣布AI對每位員工的基本期望是公司內部的重大文化轉變。 這不是短暫的趨勢。這是整合到P中的新操作範式

IBM的Z17大型機:集成AI用於增強業務運營 上個月,在IBM的紐約總部,我收到了Z17功能的預覽。 以Z16的成功為基礎(於2022年推出並證明持續的收入增長

解鎖不可動搖的信心,消除了對外部驗證的需求! 這五個CHATGPT提示將指導您完全自力更生和自我感知的變革轉變。 只需複制,粘貼和自定義包圍

人工智能安全與研究公司 Anthropic 最近的一項[研究]開始揭示這些複雜過程的真相,展現出一種令人不安地與我們自身認知領域相似的複雜性。自然智能和人工智能可能比我們想像的更相似。 窺探內部:Anthropic 可解釋性研究 Anthropic 進行的研究的新發現代表了機制可解釋性領域的重大進展,該領域旨在反向工程 AI 的內部計算——不僅僅觀察 AI 做了什麼,而是理解它在人工神經元層面如何做到這一點。 想像一下,試圖通過繪製當有人看到特定物體或思考特定想法時哪些神經元會放電來理解大腦。 A

高通的龍翼:企業和基礎設施的戰略飛躍 高通公司通過其新的Dragonwing品牌在全球範圍內積極擴展其範圍,以全球為目標。 這不僅僅是雷布蘭


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

記事本++7.3.1
好用且免費的程式碼編輯器

Dreamweaver CS6
視覺化網頁開發工具

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具