10월 9일 뉴스 최근 인공지능 분야에서 AI 대형 모델이 화제가 됐습니다. 실감나는 텍스트와 이미지를 생성하거나, 인간과 원활하게 소통하는 등 다양한 놀라운 기능을 구현할 수 있다는 것입니다. 대화. 하지만 이러한 대규모 모델 뒤에는 원시 데이터에 레이블을 추가하고 훈련에 필요한 대규모 데이터를 AI 기술에 제공하기 위해 매일 열심히 일하는 알려지지 않은 데이터 주석자 그룹이 있습니다.
데이터 주석자의 작업은 쉽지 않습니다. 지루한 작업, 저소득, 장기적인 불안정성 및 언제든지 교체될 위험에 직면해야 합니다. AI 기술 발전의 초석이지만 관심과 존경을 거의 받지 못하고 있다.
"Tech Planet"에 따르면 데이터 주석자는 가장 원시적인 성과급 시스템을 사용하여 임금을 계산합니다. 대부분의 실무자는 한 달에 5,000위안을 넘지 않습니다. 그들 중 일부는 대학 졸업자이고 일부는 어머니이며 일부는 직업을 바꾸는 사람입니다. 이들은 3선 및 4선 도시의 큐비클에서 사진, 텍스트, 음성 및 기타 데이터를 처리하여 주요 인터넷 회사와 자동차 회사에 서비스를 제공합니다.
이 사이트에서는 데이터 주석 산업 역시 부침을 겪었다는 사실을 알아냈습니다. AI 기술이 폭발적으로 성장할 것으로 예상되는 2017년에는 데이터 주석 작성자가 2D 박스 하나에 50센트로 높은 수입을 올릴 수 있었습니다. 그러나 업계의 경쟁이 심화되고 기술개발이 원활하게 이루어지지 않음에 따라 데이터 주석 단가는 점점 낮아지고 있으며 현재 최저 가격은 4센트에 불과합니다.
데이터 주석 기업 역시 엄청난 압박에 직면해 있습니다. 소스로부터 주문을 받기 위해서는 일정한 규모와 자본 준비금이 필요하며, 긴 지불 주기, 높은 직원 이직률, 불안정한 품질 및 주기 등의 문제를 안고 있어야 합니다. Haitian Ruisheng은 현재 데이터 주석 업계 최초의 주요 상장 기업으로, 지난해 이익률은 10%를 조금 넘었고, 올해 상반기에는 적자를 기록했습니다. 데이터 주석 작성자는 자신이 만든 AI로 곧 대체될 수 있다고 걱정합니다. 국내외 일부 기업에서는 데이터 세트에 레이블을 지정하기 위해 시중의 주류 대형 모델을 사용하여 자동으로 데이터에 레이블을 지정할 수 있는 도구를 개발하고 있습니다. 이러한 도구는 라벨링 효율성을 향상시키고 비용을 절감하며 수작업에 가깝거나 심지어 이를 초과하는 정확도를 달성한다고 주장합니다. 물론 모든 데이터 라벨링이 AI로 대체될 수는 없습니다. 의료, 금융, 자율주행 등 전문 지식과 논리적 분석 기능이 필요한 일부 데이터 주석에는 여전히 수동 참여가 필요합니다. 하지만 이는 업계의 문턱이 계속 높아진다는 의미이기도 합니다. 데이터 주석자에게 있어서 이 업계에서 살아남으려면 더 많은 학습과 노력이 필요할 수도 있습니다위 내용은 AI 대형 모델 데이터 주석 작업자의 월 수입은 5,000위안 이하로 떨어졌고, 주석 단가는 50센트에서 4센트로 떨어졌습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!