찾다
기술 주변기기일체 포함GPT 3.5를 미세 조정하는 방법 : AI의 잠금 해제 전위

OpenAi의 최신 언어 모델 인 GPT-3.5 Turbo는 대형 언어 모델 기능에서 주요 도약을 나타냅니다. GPT-3 모델 제품군을 기반으로하는 GPT-3.5 Turbo는 이전 버전보다 저렴하고 액세스 할 수있는 인간과 같은 텍스트를 생성 할 수 있습니다. 그러나 GPT-3.5 터보의 진정한 힘은 미세 조정이라는 프로세스를 통해 사용자 정의 할 수있는 능력에 있습니다. 미세 조정을 통해 개발자는 자체 데이터를 가져와 모델을 특정 사용 사례에 조정하고 전문화 된 작업의 성능을 크게 향상시킬 수 있습니다. 미세 조정으로 GPT-3.5 Turbo는 특정 좁은 응용 분야에서 GPT-4를 일치 시키거나 초과했습니다. 이 새로운 수준의 사용자 정의는 비즈니스와 개발자가 GPT-3.5 터보를 배포하여 맞춤형 고성능 AI 애플리케이션을 만들 수있는 잠재력을 해제합니다. GPT-3.5 Turbo와 올해 말 더 강력한 GPT-4에서 미세 조정을 이용할 수있게되면서 우리는 Applied AI의 새로운 시대의 커스에 서 있습니다.

. 왜 미세 조정 언어 모델인가? 미세 조정은 GPT-3.5 터보와 같은 대형 언어 모델을 최대한 활용하는 데 중요한 기술이되었습니다. 예를 들어 미세 조정 GPT-3에 대한 별도의 안내서가 있습니다. 미리 훈련 된 모델은 상자 밖에서 인간과 같은 텍스트를 생성 할 수 있지만 미세 조정을 통해 진정한 기능이 잠금 해제됩니다. 이 프로세스를 통해 개발자는 도메인 별 데이터에 대해 교육하여 모델을 사용자 정의 할 수 있으며,이를 범용 교육이 달성 할 수있는 것 이상의 전문 사용 사례에 적응할 수 있습니다. 미세 조정은 틈새 애플리케이션의 모델의 관련성, 정확성 및 성능을 향상시킵니다. 특정 사용 사례에 대한 사용자 정의 미세 조정을 통해 개발자는 모델을 사용자 정의하여 독특하고 차별화 된 경험을 만들어 특정 요구 사항 및 도메인을 수용 할 수 있습니다. 도메인 별 데이터에 대한 모델을 교육함으로써 해당 틈새 시장에 대해보다 관련성 있고 정확한 출력을 생성 할 수 있습니다. 이 수준의 커스터마이징은 비즈니스가 맞춤형 AI 응용 프로그램을 구축 할 수 있습니다. 개선 된 조향성 및 신뢰성 미세 조정은 지침을 따르고 신뢰할 수 있고 일관된 출력 형식을 생성하는 모델의 능력을 향상시킵니다. 형식화 된 데이터에 대한 교육을 통해이 모델은 원하는 구조와 스타일을 배우고 조향성을 향상시킵니다. 이로 인해보다 예측 가능하고 제어 가능한 출력이 발생합니다 향상된 성능

미세 조정은 모델 성능을 크게 향상시켜 미세 조정 된 GPT-3.5 터보가 특정 특수 작업에서 GPT-4 기능을 일치 시키거나 초과 할 수 있습니다. 좁은 도메인의 모델을 최적화함으로써 일반 모델과 비교하여 틈새 문제 공간에서 우수한 결과를 얻습니다. 미세 조정의 성능 리프트는 상당합니다.

12 GPT-4 오픈 소스 대안에 대한 가이드를 확인하십시오.이 가이드는 비슷한 성능을 제공 할 수 있고 실행하려면 컴퓨팅 리소스가 적을 수있는 일부 도구를 탐색합니다. 미세 조정 gpt 3.5-turbo 의 영향 OpenAI가 수행 한 베타 테스트에서 모델을 미세 조정 한 고객은 다양한 표준 응용 프로그램의 성능이 눈에 띄게 향상되었습니다. 다음은 몇 가지 주요 테이크 아웃입니다 :

1. 향상된 직접성 미세 조정을 통해 회사는 특정 지침을 준수하기 위해 모델을 더 잘 안내 할 수 있습니다. 예를 들어, 회사가 간결한 응답을 원하거나 항상 특정 언어로 답장하기 위해 모델이 필요한 경우 미세 조정이이를 달성하는 데 도움이 될 수 있습니다. 전형적인 예는 개발자가 요청할 때마다 독일어로 일관되게 답장하기 위해 모델을 조정할 수 있다는 것입니다.

2. 일관된 응답 구조화 미세 조정의 눈에 띄는 이점 중 하나는 모델의 출력을보다 균일하게 만드는 능력입니다. 이는 코드 제안 또는 API 상호 작용과 같은 특정 응답 구조가 필요한 작업에 특히 유용합니다. 예를 들어, 미세 조정을 통해 개발자는 모델을 신뢰하여 사용자 쿼리를 시스템과 호환되는 품질 JSON 형식으로 변환 할 수 있습니다.

3. 개인화 된 톤

미세 조정을 사용하여 회사의 고유 한 목소리 나 스타일과 모델의 응답을보다 면밀히 맞추기 위해 사용될 수 있습니다. 독특한 브랜드 음성을 가진 회사는이 기능을 활용하여 모델의 톤이 브랜드의 본질과 일치하도록 할 수 있습니다. 미세 조정을위한 전제 조건

미세 조정을 통해 자체 데이터에 대한 교육 프로세스를 계속하여 GPT-3.5 터보와 같은 미리 훈련 된 언어 모델을 사용자 정의 할 수 있습니다. 이것은 모델을 특정 사용 사례에 적응시키고 성능을 크게 향상시킵니다.

. 미세 조정을 시작하려면 먼저 OpenAI API에 액세스해야합니다. OpenAI 웹 사이트에 가입 한 후 API 및 모델과 상호 작용할 수있는 API 키를 얻을 수 있습니다. 다음은 미세 조정을 위해 데이터 세트를 준비해야합니다. 여기에는 텍스트 프롬프트 및 원하는 모델 응답의 예제를 치료하는 것이 포함됩니다. 데이터는 응용 프로그램이 모델을 사용하는 형식과 일치해야합니다. 필요한 JSONL 구조로 데이터를 청소하고 서식하는 것도 중요합니다.

Openai CLI는 교육 데이터를 검증하고 전처리하는 데 유용한 도구를 제공합니다. 일단 검증되면 OpenAI 서버에 데이터를 업로드 할 수 있습니다.

마지막으로, 당신은 API를 통해 미세 조정 작업을 시작하여 기본 gpt-3.5 를 선택합니다. 터보 모델과 교육 데이터 파일 전달. 미세 조정 프로세스는 데이터 크기에 따라 몇 시간 또는 며칠이 걸릴 수 있습니다. API를 통해 교육 진행 상황을 모니터링 할 수 있습니다 Openai GPT 3.5 터보 모델을 미세 조정하는 방법 : 단계별 안내서 OpenAi는 최근 미세 조정 언어 모델을위한 UI 인터페이스를 출시했습니다. 이 튜토리얼에서는 OpenAI UI를 사용하여 미세 조정 된 GPT 모델을 만듭니다. 이 부분을 따라 가려면 OpenAI 계정과 키가 있어야합니다.

1. Platform.openai.com 에 로그인하십시오

GPT 3.5를 미세 조정하는 방법 : AI의 잠금 해제 전위

2. 데이터를 준비하십시오

데모를 위해, 나는 질문 답변의 작은 데이터 세트를 기획했으며, 현재 Pandas Dataframe으로 저장되어 있습니다.

내가 한 일을 보여주기 위해 셰익스피어 스타일로 50 개의 기계 학습 질문과 답변을 만들었습니다. 이 미세 조정 작업을 통해 저는 GPT3.5-Turbo 모델의 스타일과 톤을 개인화하고 있습니다. 매우 실용적인 사용 사례는 아니지만 단순히 "셰익스피어 스타일로 답변"을 추가 할 수 있으므로 GPT3.5는 확실히 셰익스피어를 알고 필요한 톤으로 답을 생성 할 것입니다.

. OpenAi의 경우 데이터는 JSONL 형식이어야합니다. JSONL은 각 라인이 NewLines로 분리 된 유효한 JSON 객체 인 형식입니다. Pd.DataFrame을 JSONL로 변환하는 간단한 코드를 작성했습니다.

이것은 내 JSONL 파일의 모습입니다 GPT 3.5를 미세 조정하는 방법 : AI의 잠금 해제 전위

3. 미세 조정 작업을 만듭니다 Platform.openai.com으로 가서 상단 메뉴에서 미세 조정으로 이동하여 새 생성을 클릭하십시오.

기본 모델을 선택하십시오. 현재 미세 조정을위한 3 개의 모델 만 사용할 수 있습니다 (Babbage-002, Davinci-002, GPT-3.5-Turbo-0613). 다음, JSONL 파일을 업로드하고 작업 이름을 밝히고 작성을 클릭하십시오. 튜닝 작업은 데이터 세트의 크기에 따라 몇 시간 또는 며칠이 걸릴 수 있습니다. 내 예에서, 데이터 세트에는 5,500 개의 토큰 만 있었고 미세 조정에 6 시간 이상이 걸렸습니다. 이 직업의 비용은 중요하지 않았습니다 (& lt; $ 1 = 5,500/1000 x $ 0.08). 이 자습서는 UI를 사용하여 GPT 모델을 미세 조정하는 방법을 보여줍니다. API를 사용하여 동일한 것을 달성하는 방법을 배우려면 DataCamp에서 Zoumana Keita의 OpenAI API 및 Python 튜토리얼을 사용하여 미세 조정 GPT-3을 확인하십시오.

4. 미세 조정 된 모델

를 사용합니다 튜닝 작업이 완료되면 이제 API를 통해 미세 조정 된 모델을 사용하거나 Platform.openai.com에서 사용할 수있는 놀이터를 사용할 수 있습니다.

import json
import pandas as pd

DEFAULT_SYSTEM_PROMPT = 'You are a teaching assistant for Machine Learning. You should help the user to answer his question.'

def create_dataset(question, answer):
    return {
        "messages": [
            {"role": "system", "content": DEFAULT_SYSTEM_PROMPT},
            {"role": "user", "content": question},
            {"role": "assistant", "content": answer},
        ]
    }

if __name__ == "__main__":
    df = pd.read_csv("path/to/file.csv", encoding='cp1252')
    with open("train.jsonl", "w") as f:
        for _, row in df.iterrows():
            example_str = json.dumps(create_dataset(row["Question"], row["Answer"]))
            f.write(example_str + "\n")
모델 드롭 다운 하에서 이제는 선택할 수있는 개인 3.5 터보가 있습니다. 시도해 봅시다.

응답의 어조와 스타일을 확인하십시오 Openai Python 패키지로 작업하는 방법을 배우려면 프로그래밍 방식으로 Chatgpt와 대화를 나누는 방법을 배우려면 DataCamp의 Python 블로그에서 Openai API를 통해 GPT-3.5 및 GPT-4를 사용하여 확인하십시오. 안전 및 프라이버시

OpenAi는 안전을 심각하게 받아들이고 테스트, 전문가 피드백, 모델 행동 및 모니터링 시스템을 포함한 기술을 포함한 새로운 모델을 출시하기 전에 엄격한 프로세스를 가지고 있습니다. 그들은 강력한 AI 시스템을 유익하고 예측 가능한 위험을 최소화하는 것을 목표로합니다. 미세 조정을 통해 중요한 안전 기능을 보존하면서 GPT-3.5 터보와 같은 모델을 사용자 정의 할 수 있습니다. OpenAI는 위험 완화 및 모델을 조정하기 위해 측정, 모델 변경, 정책, 모니터링 등 여러 수준에서 중재를 적용합니다. OpenAi는 실현 가능한 교육 데이터에서 개인 정보를 제거하고 개인 정보로 콘텐츠를 생성하는 정책이 있습니다. 이것은 개인 정보 보호 위험을 최소화합니다.

민감한 데이터가없는 일반적인 사용 사례의 경우 OpenAI 모델을 안전하게 활용할 수 있습니다. 그러나 독점 또는 규제 데이터의 경우 데이터 난독 화, 개인 AI 프로세서 또는 사내 모델과 같은 옵션이 바람직 할 수 있습니다. 미세 조정 GPT 3.5-turbo 비용 미세 조정 및 미세 조정 GPT 3.5-Turbo 모델 사용과 관련된 세 가지 비용이 있습니다.

교육 데이터 준비.

여기에는 특정 사용 사례에 맞게 조정 된 텍스트 프롬프트 및 원하는 응답의 데이터 세트를 치료하는 것이 포함됩니다. 비용은 데이터를 공급하고 형식화하는 데 필요한 시간과 노력에 따라 다릅니다. 초기 교육 비용.

이것은 교육 데이터의 토큰 당 청구됩니다. 1,000 마리의 토큰 당 $ 0.008, 100,000 토큰 교육 세트는 초기 미세 조정의 경우 $ 800입니다. 지속적인 사용 비용. 입력 프롬프트와 모델 출력 모두에 대해 토큰 당 청구됩니다. 1,000 개의 입력 토큰 당 $ 0.012, 1,000 개의 출력 토큰 당 $ 0.016, 응용 프로그램 사용에 따라 비용이 빨리 추가 될 수 있습니다.

사용 비용 시나리오의 예를 봅시다 :

4,000 개의 토큰 프롬프트/응답이있는 챗봇, 하루에 1,000 개의 상호 작용 : (4,000/1000) 입력 토큰 x $ 0.012 x 1,000 상호 작용 = $ 48 (4,000/1000) 출력 토큰 x $ 0.016 x 1,000 상호 작용 = $ 64 일당 $ 1120 또는 $ 1120

2,000 개의 토큰 입력이있는 텍스트 요약 API, 하루 500 개의 요청 : (2,000/1000) 입력 토큰 x $ 0.012 x 500 요청 = $ 12 (2,000/1000) 출력 토큰 x $ 0.016 x 500 요청 = $ 16 참고 : 개방형 가격이 1K 토큰에 따라 인용되기 때문에 토큰으로 1000으로 나뉩니다. 실제 엔드 투 엔드 데이터 과학 프로젝트에서 chatgpt를 사용하는 방법을 배우십시오. 프로젝트 계획, 데이터 분석, 데이터 전처리, 모델 선택, 하이퍼 파라미터 튜닝, 웹 앱 개발 및 공간에 배포하는 데 ChatGpt를 사용하는 방법을 배우려면 데이터 과학 프로젝트에 ChatGpt를 사용하는 안내서를 확인하십시오.

  • 결론 우리가 큰 언어 모델 기능의 국경을 탐구 할 때, GPT-3.5 Turbo는 인간과 같은 텍스트 생성뿐만 아니라 미세 조정에 의해 잠재적 인 혁신적 인 잠재력에도 두드러집니다. 이 사용자 정의 프로세스는 개발자가 틈새 애플리케이션에 적합한 모델의 능력을 연마하여 전문 분야의 후임자들의 후임자들과 일치하거나 능가하는 우수한 결과를 얻을 수 있습니다. 직접, 응답 구조화 및 톤 개인화의 향상은 고유 한 요구 사항에 맞게 미세 조정하여 비즈니스가 고유 한 AI 중심 경험을 제공 할 수 있도록합니다. 그러나 큰 힘으로 상당한 책임이 있습니다. 생성 AI 및 언어 모델을 구현할 때 관련 비용을 이해하고 안전 및 개인 정보 보호 고려 사항을 염두에 두는 것이 중요합니다. 데이터 과학을위한 Chatgpt 치트 시트를 사용하여 데이터 과학 작업에 대한 60 개의 Chatgpt 프롬프트에 액세스하십시오.

  • 위 내용은 GPT 3.5를 미세 조정하는 방법 : AI의 잠금 해제 전위의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

    성명
    본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
    AI Index 2025 읽기 : AI는 친구, 적 또는 부조종사입니까?AI Index 2025 읽기 : AI는 친구, 적 또는 부조종사입니까?Apr 11, 2025 pm 12:13 PM

    Stanford University Institute for Human-Oriented Intificial Intelligence가 발표 한 2025 인공 지능 지수 보고서는 진행중인 인공 지능 혁명에 대한 훌륭한 개요를 제공합니다. 인식 (무슨 일이 일어나고 있는지 이해), 감사 (혜택보기), 수용 (얼굴 도전) 및 책임 (우리의 책임 찾기)의 네 가지 간단한 개념으로 해석합시다. 인지 : 인공 지능은 어디에나 있고 빠르게 발전하고 있습니다 인공 지능이 얼마나 빠르게 발전하고 확산되고 있는지 잘 알고 있어야합니다. 인공 지능 시스템은 끊임없이 개선되어 수학 및 복잡한 사고 테스트에서 우수한 결과를 얻고 있으며 1 년 전만해도 이러한 테스트에서 비참하게 실패했습니다. AI 복잡한 코딩 문제 또는 대학원 수준의 과학적 문제를 해결한다고 상상해보십시오-2023 년 이후

    Meta Llama 3.2- 분석 Vidhya를 시작합니다Meta Llama 3.2- 분석 Vidhya를 시작합니다Apr 11, 2025 pm 12:04 PM

    메타의 라마 3.2 : 멀티 모달 및 모바일 AI의 도약 Meta는 최근 AI에서 강력한 비전 기능과 모바일 장치에 최적화 된 가벼운 텍스트 모델을 특징으로하는 AI의 상당한 발전 인 Llama 3.2를 공개했습니다. 성공을 바탕으로 o

    AV 바이트 : Meta ' S Llama 3.2, Google의 Gemini 1.5 등AV 바이트 : Meta ' S Llama 3.2, Google의 Gemini 1.5 등Apr 11, 2025 pm 12:01 PM

    이번 주 AI 환경 : 발전의 회오리 바람, 윤리적 고려 사항 및 규제 토론. OpenAi, Google, Meta 및 Microsoft와 같은 주요 플레이어

    기계와 대화하는 사람의 비용 : 챗봇이 실제로 신경 쓰일 수 있습니까?기계와 대화하는 사람의 비용 : 챗봇이 실제로 신경 쓰일 수 있습니까?Apr 11, 2025 pm 12:00 PM

    연결의 편안한 환상 : 우리는 AI와의 관계에서 진정으로 번성하고 있습니까? 이 질문은 MIT Media Lab의 "AI (AI)를 사용하여 인간의 발전"심포지엄의 낙관적 톤에 도전했습니다. 이벤트는 절단 -EDG를 보여주었습니다

    파이썬의 Scipy 라이브러리 이해파이썬의 Scipy 라이브러리 이해Apr 11, 2025 am 11:57 AM

    소개 차등 방정식, 최적화 문제 또는 푸리에 분석과 같은 복잡한 문제를 해결하는 과학자 또는 엔지니어라고 상상해보십시오. Python의 사용 편의성 및 그래픽 기능은 매력적이지만 이러한 작업에는 강력한 도구가 필요합니다.

    LLAMA 3.2를 실행하는 3 가지 방법 분석 VidhyaLLAMA 3.2를 실행하는 3 가지 방법 분석 VidhyaApr 11, 2025 am 11:56 AM

    메타의 라마 3.2 : 멀티 모달 AI 강국 Meta의 최신 멀티 모드 모델 인 LLAMA 3.2는 AI의 상당한 발전으로 향상된 언어 이해력, 개선 된 정확도 및 우수한 텍스트 생성 기능을 자랑합니다. 그것의 능력 t

    Dagster와 데이터 품질 검사 자동화Dagster와 데이터 품질 검사 자동화Apr 11, 2025 am 11:44 AM

    데이터 품질 보증 : Dagster로 점검 자동화 및 큰 기대치 데이터 품질이 높다는 것은 데이터 중심 비즈니스에 중요합니다. 데이터 볼륨 및 소스가 증가함에 따라 수동 품질 관리는 비효율적이며 오류가 발생하기 쉽습니다.

    메인 프레임은 AI 시대에 역할을합니까?메인 프레임은 AI 시대에 역할을합니까?Apr 11, 2025 am 11:42 AM

    메인 프레임 : AI 혁명의 이름없는 영웅 서버는 일반 목적 애플리케이션 및 여러 클라이언트를 처리하는 데 탁월하지만 메인 프레임은 대량의 미션 크리티컬 작업을 위해 구축됩니다. 이 강력한 시스템은 자주 무거움에서 발견됩니다

    See all articles

    핫 AI 도구

    Undresser.AI Undress

    Undresser.AI Undress

    사실적인 누드 사진을 만들기 위한 AI 기반 앱

    AI Clothes Remover

    AI Clothes Remover

    사진에서 옷을 제거하는 온라인 AI 도구입니다.

    Undress AI Tool

    Undress AI Tool

    무료로 이미지를 벗다

    Clothoff.io

    Clothoff.io

    AI 옷 제거제

    AI Hentai Generator

    AI Hentai Generator

    AI Hentai를 무료로 생성하십시오.

    인기 기사

    R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
    3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
    R.E.P.O. 최고의 그래픽 설정
    3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
    R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
    3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
    WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
    3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌

    뜨거운 도구

    PhpStorm 맥 버전

    PhpStorm 맥 버전

    최신(2018.2.1) 전문 PHP 통합 개발 도구

    ZendStudio 13.5.1 맥

    ZendStudio 13.5.1 맥

    강력한 PHP 통합 개발 환경

    Atom Editor Mac 버전 다운로드

    Atom Editor Mac 버전 다운로드

    가장 인기 있는 오픈 소스 편집기

    SecList

    SecList

    SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.

    WebStorm Mac 버전

    WebStorm Mac 버전

    유용한 JavaScript 개발 도구