>  기사  >  백엔드 개발  >  130라인의 Python 코드로 핵산통계 완성, 1시간의 수작업을 2분만에 해결!

130라인의 Python 코드로 핵산통계 완성, 1시간의 수작업을 2분만에 해결!

王林
王林앞으로
2023-04-19 20:31:041504검색

130라인의 Python 코드로 핵산통계 완성, 1시간의 수작업을 2분만에 해결!

이 기간 동안 전국적으로 전염병의 확산이 사람들의 마음에 영향을 미쳤습니다. 전염병 예방 및 통제에 더 잘 협력하기 위해 푸단대학교는 3월 초부터 정기 핵산 검사를 시작했습니다.

이 작업은 상담사가 학생들의 "헬스 클라우드" 핵산 완성 스크린샷을 하나씩 확인하여 "아무도 놓치지 않는지" 확인하는 작업입니다. 간단해 보이지만 실천하기는 어렵습니다. 수십 또는 수백 개의 매우 반복적인 스크린샷에 직면하면 수동 확인은 종종 시간과 노동 집약적이며 실수로 실수가 발생할 수 있습니다.

이 문제를 해결하기 위해 정보공학부 박사과정 학생인 Li Xiaokang은 130줄의 코드를 작성하고 신속하게 작은 프로그램을 개발했습니다.

이 작은 프로그램으로 핵산 검증의 속도와 정확성이 크게 향상되어 여러 사람이 800장의 스크린샷을 1시간 이상 확인해야 했지만 이제는 결과를 얻는 데 2분밖에 걸리지 않습니다.

130라인의 Python 코드로 핵산통계 완성, 1시간의 수작업을 2분만에 해결!

출처: 웨이보 스크린샷

이후 리샤오강의 행적은 화제가 되었고, 인민일보에서도 “아는 것이 힘이다!”라고 칭찬했습니다.

푸단대학교 공식 소개에 따르면 리샤오강은 정보공학부 박사과정 학생으로 의생명공학을 전공하고 있으며, 연구 방향은 의료영상 및 인공지능이다. 일상적인 과학 연구 생활에서 그는 종종 다양한 이미지 처리 방법에 노출됩니다.

또한 Li Xiaokang은 2019년 대학 정보 1과의 상담 교사이기도 합니다. 학교가 준폐쇄경영에 들어간 뒤 자원봉사자로도 활동했다.

130라인의 Python 코드로 핵산통계 완성, 1시간의 수작업을 2분만에 해결!리샤오강은 자원봉사자로 일하고 있습니다. (출처: 푸단대학교 공식 계정)

장기적인 과학 연구 습관과 코드 민감성 덕분에 일상의 지루한 방역 작업에 직면한 리샤오강은 코드를 작성하는 아이디어 핵산 완성 스크린샷을 자동으로 확인하는 프로그램 아이디어.

130라인의 Python 코드로 핵산통계 완성, 1시간의 수작업을 2분만에 해결!Li Xiaokang과 그의 학계 및 공학 동료 간의 채팅(출처: Fudan University 공식 계정)

3월 15일 저녁, Li Xiaokang은 초기 코드를 얻는 데 1시간 이상을 소비했습니다. 프로그램을 작성하자마자 수업의 핵산 스크린샷 데이터를 검증한 결과 정확도가 매우 높다는 사실을 발견했고, 이전 수동검증에서는 발견하지 못했던 문제점까지 찾아냈다.

동시에 프로그램 실행 시간도 매우 짧습니다. 80개 이상의 사진을 처리하는 데 20초 이상이 소요되므로 검증의 정확성과 속도가 크게 향상되고 관련 인력의 작업량이 줄어듭니다.

프로그램의 구현 원리는 복잡하지 않습니다

이렇게 효율적인 프로그램을 어떻게 구현할 수 있을까요? 원리에 관해 말하자면, Li Xiaokang은 그것이 복잡하지 않다고 생각합니다.

그는 이미지 속 텍스트를 식별해 텍스트 정보로 변환할 수 있는 OCR(광학문자인식) 기술을 처음 떠올렸다.

사진에 있는 정보가 모두 유용한 것은 아니기 때문에 Li Xiaokang은 OCR이 인식한 텍스트에서 원하는 정보를 필터링할 수 있는 Python의 정규식을 생각했습니다.

130라인의 Python 코드로 핵산통계 완성, 1시간의 수작업을 2분만에 해결!프로그램의 실제 실행 과정 (출처: 복단대학교 공식 계정)

OCR 텍스트 인식 + 정규식 필터링 아이디어를 기반으로 Li Xiaokang이 개발한 프로그램은 인식된 텍스트에서 필요한 정보를 구현합니다. 텍스트를 필터링합니다. 각 스크린샷의 관련 정보를 확인한 후 모든 사람의 결과를 Excel 파일로 출력하여 수동으로 쉽게 확인할 수 있습니다.

130라인의 Python 코드로 핵산통계 완성, 1시간의 수작업을 2분만에 해결!프로그램에서 출력한 Excel 파일(출처: 푸단대학교 공식 계정)

배운 내용을 실천하고 적극적으로 전염병에 맞서 싸우기

프로그램 개발의 원래 의도에 대해 Li Xiaokang은 다음과 같이 말했습니다. 단지 자신과 주변 선생님들의 일을 줄이고 싶었을 뿐입니다. 프로그램이 Python으로 작성되어 있고 코드 주석도 완벽하게 되어 있기 때문에 Python을 사용할 줄 아는 사람이라면 빠르게 시작할 수 있습니다.

동시에 프로그래밍을 못하는 교사들의 사용을 용이하게 하기 위해 리샤오강은 코드 한 줄만 입력하면 실행할 수 있도록 프로그램을 캡슐화하기도 했습니다.

Li Xiaokang의 원래 말: “원리는 매우 간단하지만 코드를 작성할 수 있는 사람이라면 누구나 처음에는 무슨 일이 일어나고 있는지 이해할 수 있지만 관련 작업을 수행하지 않으면 시간이 얼마나 걸리는지 느끼지 못할 것입니다. - 소모하는 것은 많은 노력이 필요하고 당연히 해결책이 떠오르지 않습니다. 배운 지식을 실무에 활용하는 것뿐입니다.

푸단대학교 관계자는 학교 정보를 밝혔습니다. 사무실은 Li Xiaokang에 연락하여 필요에 따라 새로운 미니 프로그램을 개발하고 있습니다. 가까운 미래에는 교사와 학생들이 더 이상 수동으로 핵산 스크린샷을 수집할 필요 없이 미니 프로그램을 통해 직접 사진을 업로드하여 통계 결과를 볼 수 있을 것으로 예상됩니다.

위 내용은 130라인의 Python 코드로 핵산통계 완성, 1시간의 수작업을 2분만에 해결!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제