약한 지도 학습의 라벨 주석 문제 및 코드 예제
소개:
인공 지능의 발전과 함께 기계 학습은 여러 분야에서 상당한 발전을 이루었습니다. 그러나 현실 세계에서는 정확하게 주석이 달린 대규모 데이터 세트를 얻는 데 매우 많은 비용과 시간이 소요됩니다. 이러한 문제를 해결하기 위해, 노이즈가 있거나 불완전하게 레이블이 지정된 데이터를 학습에 활용하여 고성능 기계 학습 작업을 달성하는 약한 지도 학습(Weakly supervised learning)이 많은 주목을 받는 방법이 되었습니다.
약한 지도 학습에서는 라벨 주석 문제가 핵심 문제입니다. 전통적인 지도 학습 방법은 일반적으로 각 훈련 샘플이 정확한 레이블 정보를 가지고 있다고 가정하지만, 실제 시나리오에서는 이러한 완벽한 레이블을 얻기가 어렵습니다. 따라서 연구자들은 약한 지도학습(weakly supervised learning)에서 라벨 주석 문제를 해결하기 위한 다양한 방법을 제안해 왔다.
1. 다중 인스턴스 학습 방법
다중 인스턴스 학습은 일반적으로 사용되는 약한 지도 학습 방법으로, 특히 레이블 주석 문제에 적합합니다. 훈련 샘플이 여러 인스턴스로 구성되어 있으며 그 중 일부에만 레이블이 있다고 가정합니다. 샘플 수준 및 인스턴스 수준 표현을 학습하면 유용한 정보를 얻을 수 있습니다.
다음은 다중 인스턴스 학습 방법을 사용하여 이미지 분류 문제를 해결하는 코드 예제입니다.
import numpy as np from sklearn.svm import SVC from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score # 生成虚拟的多实例样本和标签 # 每个样本由多个实例组成,其中只有一个实例具有标签 X = [] Y = [] for _ in range(1000): instances = np.random.rand(10, 10) labels = np.random.randint(0, 2, 10) label = np.random.choice(labels) X.append(instances) Y.append(label) # 将多实例样本转化为样本级别的表示 X = np.array(X).reshape(-1, 100) Y = np.array(Y) # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.2) # 训练多实例学习模型 model = SVC() model.fit(X_train, y_train) # 在测试集上进行预测 y_pred = model.predict(X_test) # 计算准确率 accuracy = accuracy_score(y_test, y_pred) print("准确率:", accuracy)
2. 준지도 학습 방법
준지도 학습은 약한 지도 학습 문제를 해결하는 또 다른 방법입니다. 라벨 주석. 훈련을 위해 일부 레이블이 지정된 데이터와 레이블이 지정되지 않은 대량의 데이터를 활용합니다. 레이블이 지정되지 않은 데이터의 정보를 활용하면 모델 성능이 향상될 수 있습니다.
다음은 준지도 학습 방법을 사용하여 텍스트 분류 문제를 해결하는 코드 예제입니다.
import numpy as np from sklearn.svm import SVC from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score # 生成虚拟的带有标签和未标签的文本样本 X_labeled = np.random.rand(100, 10) # 带有标签的样本 Y_labeled = np.random.randint(0, 2, 100) # 标签 X_unlabeled = np.random.rand(900, 10) # 未标签的样本 # 将标签化和未标签化样本合并 X = np.concatenate((X_labeled, X_unlabeled)) Y = np.concatenate((Y_labeled, np.zeros(900))) # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.2) # 训练半监督学习模型 model = SVC() model.fit(X_train, y_train) # 在测试集上进行预测 y_pred = model.predict(X_test) # 计算准确率 accuracy = accuracy_score(y_test, y_pred) print("准确率:", accuracy)
요약:
약한 지도 학습의 레이블 주석 문제는 중요한 과제입니다. 다중 인스턴스 학습 및 준지도 학습과 같은 방법을 사용하여 시끄럽고 불완전하게 레이블이 지정된 데이터에 대해 고성능 기계 학습 모델을 교육할 수 있습니다. 위는 특정 문제를 해결하기 위한 참조와 영감을 제공할 수 있는 일반적으로 사용되는 두 가지 방법의 코드 예제입니다. 연구가 계속 발전함에 따라 약한 지도 학습에서 라벨 주석 문제를 해결하는 데 도움이 되는 더욱 혁신적인 방법이 등장할 것입니다.
위 내용은 약한 지도 학습의 라벨 주석 문제의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

이봐, 코딩 닌자! 하루 동안 어떤 코딩 관련 작업을 계획 했습니까? 이 블로그에 더 자세히 살펴보기 전에, 나는 당신이 당신의 모든 코딩 관련 문제에 대해 생각하기를 원합니다. 완료? - ’

AI 식품 준비 여전히 초기 사용 중이지만 AI 시스템은 음식 준비에 점점 더 많이 사용되고 있습니다. AI 구동 로봇은 부엌에서 햄버거를 뒤집기, 피자 만들기 또는 SA 조립과 같은 음식 준비 작업을 자동화하는 데 사용됩니다

소개 파이썬 기능에서 변수의 네임 스페이스, 범위 및 동작을 이해하는 것은 효율적으로 작성하고 런타임 오류 또는 예외를 피하는 데 중요합니다. 이 기사에서는 다양한 ASP를 탐구 할 것입니다

소개 생생한 그림과 조각으로 둘러싸인 아트 갤러리를 걷는 것을 상상해보십시오. 이제 각 작품에 질문을하고 의미있는 대답을 얻을 수 있다면 어떨까요? “어떤 이야기를하고 있습니까?

제품 케이던스를 계속하면서 이번 달 Mediatek은 새로운 Kompanio Ultra and Dimensity 9400을 포함한 일련의 발표를했습니다. 이 제품은 스마트 폰 용 칩을 포함하여 Mediatek 비즈니스의 전통적인 부분을 채우고 있습니다.

#1 Google은 Agent2agent를 시작했습니다 이야기 : 월요일 아침입니다. AI 기반 채용 담당자로서 당신은 더 똑똑하지 않고 더 똑똑하지 않습니다. 휴대 전화에서 회사의 대시 보드에 로그인합니다. 세 가지 중요한 역할이 공급되고, 검증되며, 예정된 FO가 있음을 알려줍니다.

나는 당신이되어야한다고 생각합니다. 우리 모두는 Psychobabble이 다양한 심리적 용어를 혼합하고 종종 이해할 수 없거나 완전히 무의미한 모듬 채터로 구성되어 있다는 것을 알고 있습니다. 당신이 fo를 뿌리기 위해해야 할 일

이번 주 발표 된 새로운 연구에 따르면 2022 년에 제조 된 플라스틱의 9.5%만이 재활용 재료로 만들어졌습니다. 한편, 플라스틱은 계속해서 매립지와 생태계에 전 세계에 쌓이고 있습니다. 그러나 도움이 진행 중입니다. 엥인 팀


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

맨티스BT
Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

MinGW - Windows용 미니멀리스트 GNU
이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.

ZendStudio 13.5.1 맥
강력한 PHP 통합 개발 환경

에디트플러스 중국어 크랙 버전
작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경
