>기술 주변기기 >일체 포함 >AI는 AI를 이길 수 없다! ChatGPT 탐지기는 무고한 학생을 자주 비난하며 210만 명의 교사가 사용합니다.

AI는 AI를 이길 수 없다! ChatGPT 탐지기는 무고한 학생을 자주 비난하며 210만 명의 교사가 사용합니다.

王林
王林앞으로
2023-04-10 23:41:011014검색

AI가 순진하게 '부정행위'라는 딱지를 붙일 때 기분이 어떤가요?

고등학생 Lucy Goetz에게 이런 일이 일어났습니다. 그녀는 원래 사회주의에 관한 독창적인 논문을 썼고 가장 높은 점수를 받았습니다.

그러나 Turnitin의 AI 글쓰기 감지기는 실제로 Goetz의 논문 끝 부분이 ChatGPT를 사용하여 생성되었다고 말했습니다.

괴츠는 "선생님들과 좋은 관계를 유지할 수 있어서 매우 기쁘다"며 충격을 받았다.

요컨대 다행히 선생님께서 저를 이해해 주시고 그렇지 않으면 황하에 뛰어들어도 깨끗이 씻을 수 없을 것입니다.

더욱 놀라운 점은 현재 210만 명의 교사가 이 ChatGPT 감지기를 사용하고 있다는 것입니다.

AI는 AI를 이길 수 없습니다

괴츠의 논문에서 플래그가 붙은 부분은 예외적이지만 감지기가 가끔 실수를 한다는 것을 보여줍니다.

분명히 AI는 AI를 이길 수 없습니다. 이는 많은 학생들에게 비참한 결과를 초래할 수 있습니다.

Turnitin의 탐지기를 테스트하기 위해 Geoffrey A. Fowler 기자는 Goetz를 포함한 고등학생 5명을 테스트했습니다.

실제 소스, AI 생성 소스, 혼합 소스를 포함하는 16개의 종이 샘플을 만들었습니다.

결과는 어땠나요?

Turnitin의 검출기는 샘플 중 최소 절반에 오류가 있었습니다. 그 중 6개만 정확하게 식별했지만 3개는 검출하지 못했습니다. 여기에는 Goetz 원본 논문의 8%에 표시 오류가 포함됩니다.

나머지 7개 기사에 대해 파울러는 "대체로 판단이 정확하기 때문에 부분점수만 주겠다. 하지만 ChatGPT나 혼합 소스에서 생성된 글의 일부 부분을 잘못 식별하고 있다"고 말했다.

그러나 Turnitin은 자사 감지기의 전체 정확도가 98%라고 주장합니다. 또한 회사는 자체 테스트에서 Goetz의 논문과 같은 상황(예: 오탐)이 1% 미만으로 발생했다고 밝혔습니다.

AI는 AI를 이길 수 없다! ChatGPT 탐지기는 무고한 학생을 자주 비난하며 210만 명의 교사가 사용합니다.

Turnitin의 AI 탐지기 세부 정보 페이지는 전체 점수를 할당하고 의심되는 AI 생성 문장을 강조 표시합니다. 회사 측은 AI가 생성한 것으로 의심되는 구절을 빨간색이 아닌 파란색으로 의도적으로 표시하고 점수 아래에 교사 리소스를 연결했다고 밝혔습니다.

캘리포니아주 콩코드에 있는 Goetz의 AP 영어 교사인 Rebecca Dell은 Turnitin의 AI 텍스트 표시 시스템이 항상 작동하는 것은 아니며 이것이 우려된다고 말했습니다.

AI 부정행위는 표절 고발과 달리 원본 문서를 증거로 삼지 않아 교사가 학생에게 편견을 가질 수 있는 가장 쉬운 방법입니다.

AI는 AI를 이길 수 없다! ChatGPT 탐지기는 무고한 학생을 자주 비난하며 210만 명의 교사가 사용합니다.

어쩌면 모든 사람이 괴츠만큼 운이 좋은 것은 아닐 수도 있습니다.

Goetz는 "학생들에게 AI 부정행위 혐의를 받는 것은 특히 두려운 일입니다. 선생님이 당신의 글쓰기 스타일을 이해하지 않거나 당신을 크게 신뢰하지 않는 한, 당신이 부정행위를 하고 있지 않다는 것을 증명할 방법이 없습니다."라고 말했습니다. AI 감지가 어려운 이유

ChatGPT가 출시된 이후 많은 대학의 학생과 교사가 매일 숙제와 교육에 사용해 왔습니다.

그러나 제한되지 않는다면 ChatGPT는 학생들이 숙제를 작성하고 시험지를 작성하는 데 도움을 줄 수 있는 역사상 가장 강력한 부정 행위 도구가 될 것입니다.

정찰에 대응하기 위해 간단하고 사용하기 쉬운 탐지기가 교사들이 기대하는 것이 되었습니다. 22세의 프린스턴 대학교 학생인 에드워드 티안(Edward Tian)이 스스로 탐지기인 GPTZero를 개발했습니다.

심지어 OpenAI는 AI Text Classifier라는 파일 탐지기라는 새로운 도구의 출시를 공식 발표했습니다.

그러나 이러한 감지기의 성능은 만족스럽지 않습니다.

AI가 만든 콘텐츠를 감지하는 것은 쉬울 것 같습니다. 그러나 손으로 쓴 이메일과 ChatGPT에서 생성된 이메일을 받으면 차이점을 구별하는 것이 거의 불가능합니다.

Turnitin의 인공 지능 부사장인 Eric Wang은 인공 지능 글쓰기를 감지하는 소프트웨어를 사용하는 데 통계가 필요하다고 말했습니다. 통계적인 관점에서 인공지능이 인간과 다른 점은 평균 수준에서 매우 안정적이라는 점이다.

직접 말하면 AI 수준이 매우 안정적입니다. 그러나 실제로는 그렇지 않습니다.

"ChatGPT와 같은 시스템은 다음으로 쓸 가능성이 가장 높은 단어를 찾는 자동 완성의 고급 버전과 같습니다. 이것이 실제로 자연스럽게 읽는 이유입니다. AI 쓰기는 인간 쓰기의 가능성이 가장 높은 하위 집합입니다. "

Turnitin의 감지기는 "글이 너무 일관적인 평균 상황을 식별"합니다. 문제는 때때로 인간의 글이 실제로 평범해 보일 수 있다는 것입니다.

경제학, 수학, 실험 보고서에서 학생들은 고정된 글쓰기 스타일을 따르는 경향이 있는데, 이는 AI 글쓰기로 오해될 가능성이 더 높다는 것을 의미합니다.

이것이 아마도 내용이 경제학과 관련되어 있기 때문에 Turnitin이 Goetz의 논문을 실수로 표시한 이유일 것입니다.

Wang은 Turnitin이 이와 관련하여 실수를 할 수 있도록 문장을 AI 생성으로 표시하기 전에 더 높은 수준의 자신감을 요구하도록 시스템을 조정하기 위해 열심히 노력했다고 말했습니다.

그의 소프트웨어가 크게 발전했다고 말했습니다. “1월 말에 Goetz의 논문을 처음 테스트했을 때 소프트웨어는 그 중 약 50%가 AI에서 생성된 것으로 식별했습니다. Turnitin은 3월 말에 시스템을 통해 내 샘플을 다시 실행했는데 그 당시에는 Goetz의 논문 중 8개만 플래그가 지정되었습니다. "

Turnitin의 감지기는 다른 중요한 기술적 한계에도 직면해 있습니다.

AI는 AI를 이길 수 없다! ChatGPT 탐지기는 무고한 학생을 자주 비난하며 210만 명의 교사가 사용합니다.

완전히 정확하게 감지된 6개의 샘플 중 모두 확실히 100% 학생 작업이거나 ChatGPT에서 생성된 것이었습니다.

하지만 AI와 인간 소스가 혼합된 논문으로 테스트했을 때 개별 문장을 잘못 식별하거나 인간 부분을 완전히 놓친 경우가 많았습니다. 그리고 문장을 재조합할 수 있는 다시 쓰기 프로그램인 Quillbot을 통해 처리된 논문에서는 ChatGPT의 흔적을 감지하지 못했습니다.

게다가 Turnitin의 감지기는 이미 현재의 인공지능 기술 수준에 뒤처져 있을 수도 있습니다.

ChatGPT를 예로 들자면 이제 GPT-4의 축복을 받아 더 창의적이고 스타일화된 기능을 갖게 되었습니다.

NVIDIA 과학자 Jim Fan은 "내 생각에는 탐지기가 장기적으로 신뢰할 수 없는 것 같다"고 말했습니다. 인공 지능은 점점 더 좋아질 것이며 점점 더 인간과 유사한 방식으로 글을 쓸 것입니다. 이러한 언어 모델의 단점은 시간이 지나면서 줄어들 것이라고 말해도 무방합니다.

AI는 AI를 이길 수 없다! ChatGPT 탐지기는 무고한 학생을 자주 비난하며 210만 명의 교사가 사용합니다.

탐지에는 AI를 활용하는 것이 좋은가요?

오류 가능성이 있는 경우(단 1%라도) 왜 AI 감지기를 출시합니까?

체치텔리는 "선생님들은 억제 효과가 있기를 바란다"고 말했다. 그러나 일부 교육자들은 이것이 실제로 학생들의 스트레스 수준을 증가시킬 수 있다고 우려합니다.

AI는 AI를 이길 수 없다! ChatGPT 탐지기는 무고한 학생을 자주 비난하며 210만 명의 교사가 사용합니다.

4월 4일, Turnitin은 약 10,700개의 중등 및 고등 교육 기관에 대해 이 ChatGPT 탐지기를 활성화하여 학생 과제에 대한 "AI 생성" 채점 및 문장별 분석을 제공했습니다.

University of Michigan-Dearborn의 디지털 교육 담당 부학장인 Mitchel Sollenberger는 Turnitin에게 초기 출시 시 자신의 캠퍼스에서 AI 탐지를 활성화하지 말라고 요청했습니다.

그는 Turnitin을 통해 매 학기마다 약 20,000개의 학생 논문을 시험하는 교사가 오탐지를 받아 근거 없는 학업 성실성 조사로 이어질 수 있다는 점을 우려하고 있습니다. 교사는 타사 소프트웨어 시스템의 전문가가 될 것으로 기대되지 않습니다.

위 내용은 AI는 AI를 이길 수 없다! ChatGPT 탐지기는 무고한 학생을 자주 비난하며 210만 명의 교사가 사용합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제