간단히 말하면, 데이터 주석은 소셜 미디어의 콘텐츠 데이터에 라벨을 붙이고, 이를 다양한 주제나 개념으로 분류하거나, 그 입장과 감정을 판단하는 것입니다. 이러한 주석이 달린 데이터는 NLP 모델의 훈련 세트 또는 평가 기준으로 사용될 수 있습니다.
또 다른 "인간의 직업"이 AI에 의해 빼앗겼으며 이는 AI 훈련과 밀접한 관련이 있습니다.
데이터 주석입니다.
취리히 대학의 연구에 따르면 ChatGPT 앞에서 인간은 비용이나 효율성 측면에서 이점이 없는 것으로 나타났습니다.
논문이 공개된 후 일부 네티즌들은 "훈련 데이터를 생성하려면 수작업이 필요하다"는 말이 이제 과거의 일이 됐다고 조롱했습니다.
"고서 복원 디지털화 작업이 가속화될 수 있을까?"
어떤 사람들은 그 흥분에도 개의치 않고 직접 트윗을 올렸습니다.
이것은 플랫폼 노동자의 일자리를 직접적으로 빼앗는 것입니다.
그런데 ChatGPT가 어떻게 데이터 주석 작업자의 "작업"을 훔쳤나요?
먼저 데이터 주석 작업의 구체적인 내용을 이해해야 합니다.
간단히 말하면, 데이터 주석은 소셜 미디어의 콘텐츠 데이터에 라벨을 붙이고, 이를 다양한 주제나 개념으로 분류하거나, 그 입장과 감정을 판단하는 것입니다.
이 주석이 달린 데이터는 NLP 모델의 훈련 세트 또는 평가 표준으로 사용될 수 있습니다.
과거에는 이런 종류의 작업이 수동으로 처리되었습니다. 예를 들어 MTurk는 데이터 주석을 전문으로 하는 크라우드소싱 플랫폼입니다.
MTurk와 같은 크라우드소싱 플랫폼에서는 전문적으로 훈련된 데이터 주석자, 크라우드소싱 작업자 등 더욱 정제된 업무 분업이 있을 것입니다.
전자는 고품질의 데이터를 생산한다는 장점이 있지만 당연히 비용이 비싸고, 후자는 저렴하긴 하지만 작업의 난이도에 따라 품질이 변동됩니다.
그래서 연구팀은 이 분야에서 대규모 언어 모델(LLM)의 잠재력을 연구하기 시작했고, 데이터 주석에 대한 추가 교육(제로샷) 없이 ChatGPT(GPT-3.5 기반)와 MTurk의 성능을 비교했습니다.
이 비교는 연구팀이 이전에 수집한 2382개의 트윗 샘플을 기반으로 합니다.
ChatGPT와 MTurk는 각각 "관련성, 위치, 주제, 정책 및 실용성"이라는 5가지 작업으로 트윗을 표시합니다.
두 가지 평가 기준이 있습니다.
결과도 명확합니다. ChatGPT는 5개 작업 중 4개에서 MTurk 크라우드소싱 작업자보다 낫습니다.
일관성 신뢰성 측면에서 ChatGPT는 모든 작업에서 전문 데이터 주석자를 능가했습니다.
AI가 24*7 작업을 할 수 있다는 점은 말할 것도 없고 비용 측면에서도 처음에 언급했듯이 ChatGPT는 수동 작업보다 평균 20배 저렴합니다.
그러나 모든 네티즌이 연구팀이 내린 결론을 받아들이지는 않았습니다. 일부 사람들은 다음과 같이 말했습니다.
이 다섯 가지 작업은 너무 간단하고 어렵습니다. 이것만으로는 그러한 결론의 신뢰성이 의심됩니다.
일부 네티즌들은 연구 표본이 너무 작다고 조롱하기도 했습니다.
(실제로는) 2382개의 트윗만 표본으로 사용되었습니다.
이제 AI가 특정 유형의 업무를 완전히 대체할지 여부는 말하기 어렵지만 인간의 업무에 어느 정도 영향을 미칠 것이라는 점에는 의심의 여지가 없습니다. .
지난주 OpenAI는 일자리의 80%가 ChatGPT의 영향을 어느 정도 영향을 받고, 일자리의 19%가 ChatGPT의 심각한 영향을 받을 것이라는 분석 보고서를 발표했습니다.
그리고 급여가 높은 직업은 더 큰 타격을 입을 것입니다.
OpenAI는 영향을 받을 특정 직업을 가장 큰 것부터 가장 작은 것까지 나열했습니다:
번역 실무자, 텍스트 제작자(시인, 작가 등 포함), 홍보 담당자, 수학자, 세무 대리인, 블록체인 엔지니어, 금융 종사자 , 미디어 실무자...
또 OpenAI CEO 알트만도 여러 차례 "AI가 기존 일자리 일부를 대체할 것"이라고 밝힌 바 있다.
얼마 전 MidjourneyV5의 대대적인 업그레이드로 인해 많은 인간 화가들이 자신의 직업이 보장되지 않는다고 불평하게 되었습니다.
으음, 아직도 직업을 유지할 수 있다고 생각하시나요?
논문 주소:https://arxiv.org/abs/2303.15056
참조 링크:https://twitter.com/arankomatsuzaki/status/1640521970608402435
위 내용은 ChatGPT는 인간보다 20배 저렴하게 데이터에 주석을 달고 작업의 80%에서 우위를 점합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!