>  기사  >  기술 주변기기  >  인간은 여전히 ​​재정적 힘을 가지고 있습니다: 연구에 따르면 ChatGPT는 회계 시험에서 대학생보다 열등합니다

인간은 여전히 ​​재정적 힘을 가지고 있습니다: 연구에 따르면 ChatGPT는 회계 시험에서 대학생보다 열등합니다

王林
王林앞으로
2023-05-01 20:37:051451검색

人类依然掌握财权:研究显示 ChatGPT 在会计考试中不如大学生

ChatGPT의 회계 시험 성적은 인간보다 훨씬 열등하고, 오답을 정당화하기 위해 심각한 말도 안되는 말을 하기까지 합니다.

미국 브리검 영 대학교의 회계 교수인 Wood와 그의 팀은 ChatGPT가 대학 회계 과정의 질문에 답변할 수 있는지 확인하기 위해 테스트하기로 결정했습니다. 그들은 소셜 미디어를 통해 14개국 186개 교육 기관에서 327명의 협력자를 유치했습니다. 회계정보시스템, 감사, 재무회계, 경영회계, 세무 등의 영역을 다루는 총 25,181개의 회계 시험 문제를 제공합니다. 그들은 또한 Wood의 딸 Jessica를 포함한 BYU 학부생들을 초대하여 ChatGPT에 2,268개의 교과서 시험 문제를 입력하도록 했습니다.

결과에 따르면 ChatGPT의 성능은 긍정적이지만 여전히 학생 수준만큼 좋지는 않습니다. 평균 학생 점수는 76.7%인 반면, ChatGPT 평균 점수는 47.4%에 불과했습니다. 11.3%의 질문에서 ChatGPT는 특히 회계 정보 시스템 및 감사 분야에서 학생 평균보다 높은 점수를 받았습니다. 그러나 ChatGPT는 세금, 금융, 관리 측면에서 부족합니다. 아마도 이러한 영역에는 더 많은 수학 능력이 필요하기 때문일 것입니다. 질문 유형 측면에서 ChatGPT는 참-거짓 질문(정확률 68.7%)과 객관식 질문(정확률 59.5%)에서는 더 우수하지만 단답형 질문(정확률 28.7%~39.1%)에는 어려움을 겪습니다. 일반적으로 더 높은 수준의 사고가 필요한 질문은 ChatGPT가 답변하기가 더 어렵습니다. 때로는 ChatGPT가 잘못된 답변에 대해 신뢰할 수 있는 설명을 제공하거나 동일한 질문에 대해 다른 답변을 제공하기도 합니다.

"완벽하지는 않습니다. 모든 것을 할 수 있다고 기대할 수는 없습니다." Jessica는 "학습을 위해 ChatGPT에만 의존하는 것은 어리석은 일입니다."라고 말했습니다.

IT House는 연구원들이 다른 흥미로운 현상도 발견했다고 언급했습니다.

  • ChatGPT 가끔 수학 문제를 풀고 있는 줄 모르고 뺄셈 문제에 두 수를 더하거나, 나눗셈을 잘못하는 등 어처구니 없는 실수를 하기도 합니다.
  • ChatGPT는 답변이 틀렸더라도 답변에 대한 설명을 제공하는 경우가 많습니다. 때로는 ChatGPT의 설명이 정확하지만 잘못된 옵션을 선택하는 경우가 있습니다.
  • ChatGPT가 가끔 말을 만들어냅니다. 예를 들어, 참조를 제공할 때 실제처럼 보이지만 실제로는 완전히 허구이며 때로는 작성자조차 존재하지 않는 참조를 생성합니다.

그럼에도 불구하고 연구원들은 ChatGPT가 향후 버전에서 회계 문제를 개선하고 위의 문제를 해결할 것이라고 믿습니다. 그들이 가장 유망하다고 생각하는 것은 챗봇이 과제 설계 및 테스트, 프로젝트 초안 작성 등 교육 및 학습을 개선하는 데 도움이 될 수 있다는 것입니다.

BYU의 회계 교수이자 해당 연구의 공동 저자 중 한 명인 Larson은 “이것은 우리가 귀중한 정보를 가르치고 있는지 반성하고 확인할 수 있는 기회입니다. 다음에 해야 할 일. 물론 조교는 계속하겠지만 내용은 달라질 것입니다.

이 연구는 Issues in Accounting Education에 게재되었습니다.

위 내용은 인간은 여전히 ​​재정적 힘을 가지고 있습니다: 연구에 따르면 ChatGPT는 회계 시험에서 대학생보다 열등합니다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제