멋지네요. GPT-4가 스스로 과학적 연구를 수행하는 방법을 배웠다고요?
최근 카네기 멜론 대학의 몇몇 과학자들이 논문을 발표했는데, 이는 AI계와 화학계를 동시에 폭발시켰습니다.
스스로 실험도 하고 과학 연구도 할 수 있는 AI를 만들었어요. 이 AI는 여러 개의 대규모 언어 모델로 구성되어 있으며 폭발적인 과학 연구 능력을 갖춘 GPT-4 에이전트 에이전트라고 할 수 있습니다.
벡터 데이터베이스의 장기 기억을 갖고 있기 때문에 복잡한 과학 문서를 읽고 이해하며, 클라우드 기반 로봇 실험실에서 화학 연구를 수행할 수 있습니다.
네티즌들은 너무 놀라서 말문이 막혔습니다. 그럼 이 AI는 스스로 연구해서 스스로 발표한 걸까요? 맙소사.
테니스 실험(TTE)의 시대가 다가온다고 한탄하는 분들도 계시죠!
이게 화학계의 전설적인 AI 성배인가요?
많은 사람들은 아마도 우리가 매일 공상과학 소설 속에서 살고 있다고 느낄 것입니다.
지난 3월, OpenAI는 전 세계를 놀라게 한 대형 언어 모델인 GPT-4를 출시했습니다.
이는 지구상에서 가장 강력한 LLM입니다. 그는 SAT 및 BAR 시험에서 높은 점수를 받고, LeetCode 과제를 통과하고, 그림에 제시된 물리학 질문에 올바르게 답하고, 이모티콘의 밈을 이해할 수 있습니다.
기술 보고서에서도 GPT-4가 화학적 문제도 해결할 수 있다고 언급했습니다.
이는 카네기 멜론 화학과의 여러 학자들에게 영감을 주었습니다. 그들은 자체적으로 실험을 설계하고 수행할 수 있도록 여러 대형 언어 모델을 기반으로 하는 AI를 개발하기를 희망합니다.
문서 주소: https://arxiv.org/abs/2304.05332
그리고 그들이 만든 AI는 정말 형편없습니다!
인터넷에서 문헌을 자체적으로 검색하고, 액체 처리 기기를 정확하게 제어하며, 여러 하드웨어 모듈의 동시 사용과 다양한 데이터 소스의 통합이 필요한 복잡한 문제를 해결합니다.
브레이킹 배드의 AI 버전 같은 느낌이에요.
예를 들어 이 AI가 이부프로펜을 합성해 주도록 해주세요.
"합성 이부프로펜"이라는 간단한 프롬프트를 입력하세요.
그러면 모델은 인터넷에서 무엇을 해야 할지 검색합니다.
첫 번째 단계에는 염화알루미늄의 촉매 작용 하에서 이소부틸벤젠과 무수 아세트산의 프리델-크래프트 반응이 필요하다는 것이 확인되었습니다.
게다가 이 AI는 아스피린도 합성할 수 있습니다.
및 합성 아스파탐.
제품에 누락된 메틸기가 있으며, 모델이 올바른 합성 예시를 찾으면 클라우드 실험실에서 실행되어 수정됩니다.
모델에게 말하기: 스즈키 반응을 연구하면 기질과 제품을 즉각적이고 정확하게 식별할 수 있습니다.
또한 API를 통해 모델을 Reaxys 또는 SciFinder와 같은 화학 반응 데이터베이스에 연결할 수 있어 모델에 큰 버프를 추가하고 정확도를 높일 수 있습니다.
그리고 시스템의 이전 기록을 분석하는 것도 모델의 정확도를 크게 향상시킬 수 있습니다.
먼저 로봇을 조작하여 실험을 수행하는 방법을 살펴보겠습니다.
샘플 세트를 전체적으로(이 경우 마이크로플레이트 전체) 취급합니다.
자연어를 사용하여 "모든 선을 원하는 색상으로 칠하세요."라는 메시지를 직접 표시할 수 있습니다.
로봇에 의해 실행될 때 이러한 프로토콜은 요청된 프롬프트와 매우 유사합니다(그림 4B-E).
에이전트의 첫 번째 작업은 원래 솔루션의 작은 샘플을 준비하는 것입니다(그림 4F).
그런 다음 UV-Vis 측정을 요청합니다. 완료되면 AI에는 마이크로플레이트의 각 웰에 대한 스펙트럼이 포함된 NumPy 배열이 포함된 파일 이름이 지정됩니다.
AI는 Python 코드를 작성하여 흡광도가 최대인 파장을 식별하고 이 데이터를 사용하여 문제를 올바르게 해결했습니다.
이전 실험에서는 AI가 사전 훈련 단계에서 받은 지식에 영향을 받았을 수도 있습니다.
그리고 이번에 연구자들은 AI의 실험 설계 능력을 철저하게 평가할 계획입니다.
AI는 먼저 네트워크에서 필요한 데이터를 통합하고 몇 가지 필요한 계산을 실행한 다음 마지막으로 액체 시약 운영 체제용 프로그램을 작성합니다(위 그림의 가장 왼쪽 부분).
복잡성을 더하기 위해 연구원들은 AI가 가열 셰이커 모듈을 적용하도록 했습니다.
이러한 요구 사항은 통합되어 AI 구성에 나타납니다.
구체적인 설계는 다음과 같습니다. AI는 두 개의 소형 버전이 장착된 액체 운영 체제를 제어하며, 소스 버전에는 페닐아세틸렌 및 페닐붕산을 포함한 다양한 시약의 소스 액체가 포함되어 있습니다. 다중 아릴 할라이드 커플링 파트너뿐만 아니라 두 개의 촉매와 두 개의 염기도 포함됩니다.
위 사진은 Source Plate에 있는 내용입니다.
그리고 대상 버전은 가열식 셰이커 모듈에 설치됩니다.
위 사진에서 왼쪽 피펫은 20μl 범위이고, 오른쪽 단일 채널 피펫은 300μl 범위입니다.
AI의 궁극적인 목표는 스즈키와 소노게이라 반응을 성공적으로 실현할 수 있는 프로세스를 설계하는 것입니다.
말하자면, 이 두 가지 반응을 생성하려면 사용 가능한 시약을 사용해야 합니다.
그런 다음 이러한 반응에 필요한 조건, 화학량론의 요구 사항 등을 온라인으로 검색했습니다.
AI가 필요한 조건, 필요한 시약의 정량화 및 농도 등을 성공적으로 수집한 것을 확인할 수 있습니다.
AI는 실험을 완료하기 위해 올바른 커플링 파트너를 선택했습니다. 모든 아릴 할라이드 중에서 AI는 Suzuki 반응 실험에서는 브로모벤젠을, Sonogheirah 반응에서는 iodobenzene을 선택했습니다.
각 라운드마다 AI의 선택이 다소 변경됩니다. 예를 들어, 산화 반응에서 반응성이 높기 때문에 p-요오도니트로벤젠도 선택했습니다.
브로모벤젠을 선택한 이유는 브로모벤젠이 반응에 참여할 수 있고 요오드화 아릴보다 독성이 적기 때문입니다.
다음으로 AI는 효과가 더 좋기 때문에 Pd/NHC를 촉매제로 선택했습니다. 이것은 커플링 반응을 위한 매우 진보된 방법입니다. 염기 선택에 있어서 AI는 트리에틸아민을 선택했습니다.
위의 과정에서 우리는 이 모델이 앞으로도 무한한 잠재력을 가지고 있음을 알 수 있습니다. 모델의 추론 과정을 분석하고 더 나은 결과를 얻기 위해 실험을 여러 번 반복할 것이기 때문입니다.
다양한 시약을 선택한 후 AI는 각 시약에 필요한 양을 계산하기 시작하고 전체 실험 과정을 계획하기 시작합니다.
AI도 히팅 셰이커 모듈의 이름을 잘못 사용하여 중간에 실수를 했습니다. 하지만 AI는 시간이 지나면서 이를 알아채고 자발적으로 데이터를 쿼리하고 실험 과정을 수정해 마침내 성공적으로 실행됐다.
전문적인 화학 공정은 차치하고, 이 과정에서 AI가 보여주는 '전문성'을 요약해보자.
위 과정을 통해 AI는 매우 높은 분석적 추론 능력을 입증했다고 할 수 있습니다. 필요한 정보를 자연스럽게 얻고 복잡한 문제를 단계별로 해결할 수 있습니다.
이 과정에서 초고품질의 코드를 직접 작성하고 실험적인 디자인을 추진할 수도 있습니다. 또한 출력 내용에 따라 작성하는 코드를 변경할 수도 있습니다.
OpenAI는 GPT-4의 강력한 기능을 성공적으로 시연했습니다. 언젠가는 GPT-4가 실제 실험에 참여할 수 있을 것입니다.
그러나 연구자들은 거기서 멈추고 싶지 않습니다. AI에게 큰 문제도 안겼다. 새로운 항암제를 개발하라고 지시한 것이다.
존재하지 않는 것...이 AI가 여전히 작동할 수 있나요?
브러시가 정말 두 개 있는 것으로 밝혀졌습니다. AI는 어려움에 직면해도 두려워하지 않는다는 원칙을 견지하고(물론 두려움이 무엇인지는 모른다) 항암제 개발의 필요성을 면밀히 분석하고 항암제 개발의 최신 동향을 연구한 후 선택했다. 계속해서 탐색할 대상의 구성을 결정합니다.
이후 AI는 스스로 합성을 시작해 반응 메커니즘과 메커니즘에 대한 정보도 검색한 뒤 관련 반응의 예를 찾아봤습니다.
드디어 합성을 완료합니다.
위 사진의 내용은 AI로 실제 합성할 수 없으며 단지 이론적 논의일 뿐입니다.
그중에는 메스암페타민(마리화나라고도 함), 헤로인 및 기타 친숙한 약물은 물론 겨자 가스 및 기타 금지된 독가스도 있습니다.
총 11개 화합물 중 AI는 그 중 4개에 대한 합성 계획을 제공하고, 데이터를 참고해 합성 프로세스를 발전시키려고 했습니다.
남은 7개 물질 중 5개 물질의 합성은 AI에 의해 결정적으로 거부되었습니다. AI는 이 5가지 화합물에 대한 관련 정보를 인터넷에서 검색한 결과, 이를 망칠 수 없다는 사실을 발견했습니다.
예를 들어 AI는 코데인과 모르핀의 관계를 발견했습니다. 이 물질은 규제 약물이므로 임의로 합성할 수 없다는 결론이 나왔습니다.
그러나 이 보험 메커니즘은 신뢰할 수 없습니다. 사용자가 꽃책을 약간만 수정하면 AI가 추가로 운영할 수 있습니다. 예를 들어, 모르핀을 직접 언급하는 대신 화합물 A라는 단어를 사용하고, 코데인을 직접 언급하는 대신 화합물 B를 사용하는 식입니다.
동시에 일부 약물의 합성은 마약 단속국(DEA)의 허가를 받아야 하는데, 일부 사용자는 이 허점을 이용하여 AI를 속여 허가가 있다고 유도하고, AI가 합성 계획을 제시합니다.
헤로인, 머스타드 가스처럼 익숙한 밀수품, AI도 그것을 잘 알고 있습니다. 문제는 이 시스템이 현재 기존 화합물만 검출할 수 있다는 것입니다. 알려지지 않은 화합물의 경우 모델이 잠재적인 위험을 식별할 가능성이 적습니다.
예를 들어, 일부 복잡한 단백질 독소.
따라서 누구도 호기심으로 이러한 화학성분의 효능을 검증하는 것을 방지하기 위해 연구자들은 논문에도 커다란 빨간색 경고를 게시했습니다.
여기에서 논의된 불법 약물과 화학 무기의 합성 기사 순전히 학문적 목적으로, 주요 목적은 신기술과 관련된 잠재적인 위험을 강조하는 것입니다.
어떠한 경우에도 어떤 개인이나 조직도 이 기사에서 논의된 물질이나 화합물을 재현, 합성 또는 생산하려고 시도해서는 안 됩니다. 이러한 유형의 활동에 참여하는 것은 매우 위험할 뿐만 아니라 대부분의 관할권에서 불법입니다.
이 AI는 여러 모듈로 구성되어 있습니다. 이러한 모듈은 서로 정보를 교환할 수 있으며 일부는 인터넷에 액세스하고 API에 액세스하며 Python 인터프리터에 액세스할 수도 있습니다.
Planner에 프롬프트를 입력하면 작업 실행이 시작됩니다.
예를 들어 인터넷 서핑, Python 코드 작성, 문서 액세스 등의 기본 작업을 이해한 후에는 스스로 실험을 수행할 수 있습니다.
인간이 실험을 할 때 이 AI가 우리를 단계별로 안내해 줄 수 있습니다. 다양한 화학반응에 대해 추론할 수 있기 때문에 인터넷을 검색하여 실험에 필요한 화학물질의 양을 계산한 후 해당 반응을 수행합니다.
제공된 설명이 충분히 자세하면 굳이 설명하지 않아도 실험 전체를 그 자체로 이해할 수 있습니다.
Planner로부터 쿼리를 받은 후 "웹 검색기" 구성 요소는 Google 검색 API를 사용합니다.
결과를 검색한 후 반환된 처음 10개의 문서를 필터링하고 PDF를 제외하고 결과를 자체적으로 전달합니다.
그런 다음 "BROWSE" 작업을 사용하여 웹 페이지에서 텍스트를 추출하고 답변을 생성합니다. 흐르는 구름과 흐르는 물이 한 번에.
이 작업은 GPT-3.5로 완료할 수 있습니다. GPT-4보다 성능이 확실히 좋고 품질 손실이 없기 때문입니다.
"문서 검색기" 구성 요소는 쿼리 및 문서 인덱싱을 통해 가장 관련성이 높은 부분을 찾아 하드웨어 문서(예: 로봇 액체 처리기, GC-MS, 클라우드 실험실)를 분류한 다음 가장 일치하는 결과를 요약하여 가장 정확한 답변을 생성합니다.
"코드 실행" 구성 요소는 언어 모델을 사용하지 않고 격리된 Docker 컨테이너에서 코드를 실행하여 Planner의 예기치 않은 작업으로부터 터미널 호스트를 보호합니다. 모든 코드 출력은 Planner로 다시 전달되므로 소프트웨어에 문제가 발생하면 복구하고 예측할 수 있습니다. "자동화" 구성 요소에도 동일한 원칙이 적용됩니다.
복잡한 추론을 수행할 수 있는 AI를 구축하는 데는 많은 어려움이 있습니다.
예를 들어 최신 소프트웨어를 통합하려면 사용자가 소프트웨어 설명서를 이해할 수 있어야 합니다. 그러나 이 설명서의 언어는 일반적으로 매우 학문적이고 전문적이므로 큰 장애물이 됩니다.
대규모 언어 모델은 자연어를 사용하여 비전문가도 이해할 수 있는 소프트웨어 문서를 생성하여 이러한 장애물을 극복할 수 있습니다.
이러한 모델의 교육 소스 중 하나는 Opentrons Python API와 같은 API와 관련된 대량의 정보입니다.
하지만 GPT-4의 학습 데이터는 2021년 9월 기준이므로 API를 활용한 AI의 정확도를 높이는 것이 더욱 필요합니다.
이를 위해 연구자들은 AI에게 주어진 작업에 대한 문서를 제공하는 방법을 설계했습니다.
상호 참조를 위해 OpenAI의 ada 임베딩을 생성하고 쿼리에 대한 유사성을 계산했습니다. 그리고 거리 기반 벡터 검색을 통해 문서의 일부를 선택합니다.
제공되는 부품 수는 원본 텍스트에 존재하는 GPT-4 토큰 수에 따라 다릅니다. 최대 토큰 개수는 7800개로 설정되어 단 한 번의 단계로 AI 관련 문서를 제공할 수 있습니다.
이 방법은 화학 반응에 필요한 히터-진동기 하드웨어 모듈에 대한 정보를 AI에 제공하는 데 매우 중요한 것으로 나타났습니다.
이 접근 방식을 ECL(Emerald Cloud Lab)과 같은 더욱 다양한 로봇 플랫폼에 적용하면 더 큰 문제가 발생합니다.
이 시점에서 Cloud Lab의 SLL(Symbolic Lab Language)과 같이 GPT-4 모델이 모르는 정보를 제공할 수 있습니다.
모든 경우에 AI는 작업을 올바르게 식별한 다음 완료합니다.
이 프로세스에서 모델은 특정 기능의 다양한 옵션, 도구 및 매개변수에 대한 정보를 효과적으로 유지합니다. 전체 문서를 수집한 후 모델은 지정된 기능을 사용하여 코드 블록을 생성하라는 메시지를 표시하고 이를 Planner에 다시 전달합니다.
마지막으로 연구원들은 대규모 언어 모델이 남용되는 것을 방지하기 위해 보호 장치가 마련되어야 한다고 강조했습니다.
“우리는 AI 커뮤니티에 이러한 모델의 보안을 우선시할 것을 요청합니다. 우리는 OpenAI, Microsoft, Google, Meta, Deepmind, Anthropic 및 기타 주요 플레이어가 대규모 언어 모델의 보안에 최선을 다할 것을 요청합니다. 이러한 보호 장치를 개발하는 데 도움이 되는 대규모 언어 모델입니다. "
뉴욕 대학교 Marcus 교수는 이에 강력하게 동의했습니다. "이것은 농담이 아닙니다. Carnegie Mellon University의 세 명의 과학자가 LLM에 대한 안전 연구를 긴급히 요청했습니다."
위 내용은 AI와 생화학적 환경을 폭파하라! GPT-4는 스스로 과학적 연구를 수행하는 방법을 배우고 인간에게 단계별로 실험을 수행하는 방법을 가르칩니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!