Genai (Genai)와 LLM (Lange Language Models)은 특히 데이터 과학 내에서 전문 세계를 재구성하고 있습니다. 이 Genai 중심 환경은 주목 받고 설립 된 데이터 과학자 모두에게 전례없는 과제를 제시합니다. 이 기사는 6 년 넘게 전통적인 ML 및 Genai와 함께 일한 통찰력과 경험을 공유하며 성공적인 데이터 과학자의 진화하는 역할에 대한 관점을 제공합니다.
.면책 조항 :
아래의 일화는 가상화 될 수 있습니다? 이 기사가 도움이되면 좋아하고 댓글을 달아주세요! 내 블로그에서 원래 게시물을 찾을 수도 있습니다. ? 인기없는 의견 : 데이터 과학자 역할은 그 어느 때보 다 더 까다 롭습니다.
목차
"좋은"데이터 과학자 정의 <:> 챌린지 #1 : 높은 기대치, 제한된 데이터 및 전략 <:> 챌린지 #2 : AI 과대 광고 및 자체 선포 전문가 <:> 챌린지 #3 : 조직 전반의 일관되지 않은 데이터 과학 역할 <:> 챌린지 #4 : 지속적인 데이터 품질 문제 <:> 챌린지 #5 : 도메인 전문 지식에 대한 중요한 요구 <:> 챌린지 #6 : "OPS"풍경 탐색 (DataOps, Mlops, Aiops, Llmops) <:> 챌린지 #7 : 빠른 기술 발전에 적응1. "좋은"데이터 과학자 정의결론 참조
> "딥 러닝? 우리는 여기서 학습에 중점을두고 있습니다. 데이터 엔지니어링은 어디에 있는지입니다." - 가상 고용주, 2015
-
내 여정은 R과 SQL로 시작하여 북유럽 주식 시장 동향을 분석했습니다. 내가 공부 한 최첨단 딥 러닝은 펠트 월드를 멀리했습니다. 이제 LLM, Genai 및 에이전트 워크 플로우에 중점을 둡니다. 이러한 변화는 기존 ML/DL에서 생성 AI 및 LLM에 이르기까지 데이터 전문가에 대한 기대의 광범위한 진화를 반영합니다. "좋은"데이터 과학자의 정의가 확장되었습니다. A/B 테스트 및 통계 모델링에서 엔드 투 엔드 (E2E) ML 파이프 라인 소유권에 이르기까지 역할은 크게 다릅니다. 그러나 핵심 기술은 필수적입니다
Genai 시대의 V 자형 데이터 과학자 (참조 참조 [1])
-
내 논문은 빠른 변화의 시대에 성공하기위한 V 자형 스킬 셋을 강조합니다.
> Deep AI/ML 전문 지식
- 데이터 엔지니어링
- 이 기초를 사용하여 현재의 도전을 탐구합시다 2. 챌린지 #1 : 높은 기대치, 제한된 데이터 및 전략
-
이러한 과제는 AI 이니셔티브를 추구하기 전에 기본적인 지원의 필요성을 강조합니다. 3. 챌린지 #2 : AI 과대 광고 및 자체 선언 전문가 - 자체 선언 된 전문가의 상승 : 진정한 전문 지식이 부족하면 진보를 방해 할 수 있습니다. 오정렬 된 기술 : 팀은 AI 도구 기술을 보유 할 수 있지만 모델을 제작, 미세 조정 및 효과적으로 배포 할 전문 지식이 부족합니다. 플러그 앤 플레이 솔루션에 대한
- 직무 응용 프로그램 및 인터뷰 중 혼란 기술 과부하 및 번 아웃 : 다양한 지역에서 능숙해야한다는 압력. AI 엔지니어링으로의 전환 : 데이터 과학 및 소프트웨어 엔지니어링을 연결하는 전문가에 대한 수요 증가.
-
구직 과정에서의 선명도는 중요합니다 5. 도전 #4 : 지속적인 데이터 품질 문제 "데이터, 내 친구, 원수 및 파트너. LLM을 사용하여 합성 데이터를 생성해야합니까?" - 가상 데이터 과학자, 2024 - 쓰레기통, 쓰레기 아웃 (Gigo)은 여전히 중요한 문제로 남아 있습니다. 많은 회사는 데이터에 대한 포괄적 인 이해가 부족하여 데이터를 AI에 효과적으로 사용하는 데 어려움을 겪습니다. 6. 도전 #5 : 도메인 전문 지식에 대한 중요한 요구
- LLM은 강력하지만 깊은 도메인 전문 지식은 여전히 중요합니다. 도메인 전문가와의 협력은 다음과 같습니다 상황에 맞는 이해 :
- 데이터 분석에서 종종 누락 된 컨텍스트 제공 모델 미세 조정 : 모델이 산업 표준과 일치하는지 확인 위험 완화 및 준수 : 민감한 부문의 규정 탐색 7. 챌린지 #6 : "OPS"풍경 탐색
-
"데이터 파이프 라인, 모델 배포, LLM 최적화 및 클라우드 인프라는 모델을 교육하고 싶었습니다!" - 가상 데이터 과학자, 2024
AI 시스템 운영이 중요합니다. DataOps, Mlops, AIOP 및 LLMOPS 이해 성공적인 생산 배포에는 필수적입니다.
8. 도전 #7 : 빠른 기술 발전에 적응하는
"새 라이브러리는 스택과 호환되지 않지만 더 빠릅니다. 적합하게 만들 것입니다." - A 가상의 엔지니어링 관리자, 2024 압도적 인 도구 선택 :
지속적인 학습 및 적응이 필요합니다올바른 도구를 선택하는 데 어려움 조각화 및 통합 : 다른 시스템을 통합하는 데 어려움을 겪습니다
진화하는 기술 :혁신 혁신 및 실용성 균형 :
9. 결론적 인 생각진정한 혁신을 과대 광고와 구별합니다 프로그래밍 역할의 미래 : AI의 프로그래밍 작업을 자동화 할 수있는 잠재력.
- 중간 . [원본 중간 기사 링크] [2-10] [나머지 참조에 대한 링크]
데이터 과학 분야는 빠르게 발전하고 있습니다. 성공은 기술 전문 지식, 비즈니스 통찰력, 협업 기술 및 지속적인 학습에 대한 헌신의 조화가 필요합니다. 10. 참고 문헌 [1] Elwin, M. (2024). 생성 AI 시대의 V 자형 데이터 과학자.
"우리는 AI, Genai, LLMS가 필요합니다! 경쟁 업체는 chatgpt를 사용하고 있습니다. 챗봇을 구축하십시오! 오, 첫 해에 대한 데이터가 없습니다. 개인 정보 보호 문제." - A 가상 관리자, 2023ai는 많은 조직에서 최우선 과제입니다. Chatgpt의 부상은 "AI 중심"사업을 향한 서두를 촉발했습니다. LLM을 통해 AI를 통합하는 것은 쉬운 것처럼 보이지만 현실은 복잡합니다.
데이터 부족 : 강력한 데이터 파이프 라인이 중요합니다. 데이터 과학자들은 종종 데이터 엔지니어링 리소스가 이러한 파이프 라인을 구축하기 위해 옹호하는 데 시간을 소비합니다. 또한 데이터는 종종 흩어져 있고 일관성이 없으며 구조적으로 제한되지 않습니다
데이터 전략 부족 :
AI 전략의 부재 :
많은 회사들이이를 위해 AI를 채택합니다. 정의 된 사용 사례와 ROI가있는 명확한 AI 전략이 필수적입니다.액세스 가능하지만 이러한 솔루션은 종종 사용자 정의, 확장 성 및 주소 보안/규정 준수 문제가 부족합니다. LLM 기능의 오해 :
4. 도전 #3 : 조직 전반의 일관되지 않은 데이터 과학 역할
A/B 테스트, 사용자 행동 분석에 중점을 둡니다 데이터 엔지니어 :"데이터 과학자? ?이 SQL 쿼리에 도움을 줄 수 있습니까?" - 가상 동료, 2024 데이터 과학자 역할에는 명확한 정의가 부족합니다. 책임은 매우 다양합니다
제품 분석가 :
데이터 파이프 라인 구축 및 유지 관리에 중점을 둡니다
머신 러닝 엔지니어 : 전체 ML 모델 라이프 사이클에 중점을 둡니다.
-
정의되지 않은 역할 :
"당신은 과학자가 아닌가? 금융과 법률에 관한 모든 것을 알고 있어야합니까? Chatgpt를 사용하십시오!" - 가상 도메인 전문가, 2022-2023
위 내용은 인기없는 의견 : 그것은 좋은 데이터 과학자가되기보다 그 어느 때보 다 어렵다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

과학자들은 C. el 그러나 중요한 질문이 발생합니다. 새로운 AI S와 함께 효과적으로 작동하도록 우리 자신의 신경망을 어떻게 조정합니까?

Google의 Gemini Advanced : 수평선의 새로운 가입 계층 현재 Gemini Advanced에 액세스하려면 $ 19.99/월 Google One AI Premium Plan이 필요합니다. 그러나 Android Authority 보고서는 다가오는 변경 사항을 암시합니다. 최신 Google p. 내 코드

고급 AI 기능을 둘러싼 과대 광고에도 불구하고 Enterprise AI 배포 내에서 상당한 도전 과제 : 데이터 처리 병목 현상. CEO는 AI 발전을 축하하는 동안 엔지니어는 느린 쿼리 시간, 과부하 파이프 라인,

문서 처리는 더 이상 AI 프로젝트에서 파일을 여는 것이 아니라 혼돈을 명확하게 전환하는 것입니다. PDF, PowerPoint 및 Word와 같은 문서는 모든 모양과 크기로 워크 플로우를 범람합니다. 구조화 된 검색

Google의 에이전트 개발 키트 (ADK)의 전력을 활용하여 실제 기능을 갖춘 지능형 에이전트를 만듭니다! 이 튜토리얼은 Gemini 및 GPT와 같은 다양한 언어 모델을 지원하는 ADK를 사용하여 대화 에이전트를 구축하는 것을 안내합니다. w

요약: SLM (Small Language Model)은 효율성을 위해 설계되었습니다. 자원 결핍, 실시간 및 개인 정보 보호 환경에서 LLM (Large Language Model)보다 낫습니다. 초점 기반 작업, 특히 도메인 특이성, 제어 성 및 해석 성이 일반적인 지식이나 창의성보다 더 중요합니다. SLM은 LLM을 대체하지는 않지만 정밀, 속도 및 비용 효율성이 중요 할 때 이상적입니다. 기술은 더 적은 자원으로 더 많은 것을 달성하는 데 도움이됩니다. 그것은 항상 운전자가 아니라 프로모터였습니다. 증기 엔진 시대부터 인터넷 버블 시대에 이르기까지 기술의 힘은 문제를 해결하는 데 도움이되는 정도입니다. 인공 지능 (AI) 및보다 최근에 생성 AI가 예외는 아닙니다.

컴퓨터 비전을위한 Google Gemini의 힘을 활용 : 포괄적 인 가이드 주요 AI 챗봇 인 Google Gemini는 강력한 컴퓨터 비전 기능을 포괄하기 위해 대화를 넘어서 기능을 확장합니다. 이 안내서는 사용 방법에 대해 자세히 설명합니다

2025 년의 AI 환경은 Google의 Gemini 2.0 Flash와 Openai의 O4-Mini가 도착하면서 전기가 전환됩니다. 이 최첨단 모델은 몇 주 간격으로 발사되어 비슷한 고급 기능과 인상적인 벤치 마크 점수를 자랑합니다. 이 심층적 인 비교


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

안전한 시험 브라우저
안전한 시험 브라우저는 온라인 시험을 안전하게 치르기 위한 보안 브라우저 환경입니다. 이 소프트웨어는 모든 컴퓨터를 안전한 워크스테이션으로 바꿔줍니다. 이는 모든 유틸리티에 대한 액세스를 제어하고 학생들이 승인되지 않은 리소스를 사용하는 것을 방지합니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

mPDF
mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

Atom Editor Mac 버전 다운로드
가장 인기 있는 오픈 소스 편집기
