思路总结-----对微博情感分析的的挖掘-MySQL 튜토리얼-php.cn

집

데이터 베이스

MySQL 튜토리얼

思路总结-----对微博情感分析的的挖掘

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 02:52 PM

분석하다웨이보아이디어요약감정파기친구

一朋友由于工作需要，准备对新浪微博进行相关的抓取挖掘。特别是情感分析这一块，便于他后期的实验实践。实际上，文本挖掘及分析在未来都会产生较大的效果。举一个简单的例子，现在地铁里的每个人每天都会去刷新自己的人人好友圈，微信好友消息。而这些消息

一朋友由于工作需要，准备对新浪微博进行相关的抓取挖掘。特别是情感分析这一块，便于他后期的实验实践。实际上，文本挖掘及分析在未来都会产生较大的效果。举一个简单的例子，现在地铁里的每个人每天都会去刷新自己的人人好友圈，微信好友消息。而这些消息大部分是基于文本的。如何对这些原始的消息进行挖掘。进而为相应的精准营销做准备。在以后的营销中将会产生重大效果。

原始数据

这一部分的内容，我们可以通过爬虫技术来抓取。通过聚类算法，找到相同话题的所有微博。然后拿来做为原始数据。还有就是用户好友圈内的评价消息，还有用户产生的连接消息，等等。这些都可以作为原始数据来归入我们的数据库。

确订目标(商业理解)

这一步也同时与业务理解要很好的关联起来，首先，我们是要用这些原始数据来作什么？比如，我们用情感分析，所有不同用户对同一事件的理解。我们要将他们的微博信息里的关键词找出来。然而进行相应的查找算法，进而确定所有用户对这一事件的评价。然后，我们要通过用户的评价，找到有二次商业利用值的客户。然后确订为目标客户。

数据理解

所抓取到的微博内容是什么，里边带几个链接？是用什么符号与之相连？文字，图片的分类，另外还有评论信息是否也有参考价值。里边的特殊符号代表什么？等等。这些信息，那些是对我们的来说是有用的，如何去用？比如说要从文本中挖掘出关建字，进行相关的营销活动。从而确定博主的情感动向。进而可以做些什么？理解我们的数据，才能更好的抓取到我们所要使用的数据。

模型建立

有人说，搞数据挖掘的人就是要来做这一部分的内容。你要建立一个好的模型，那以后的数据通过你的这个模型，那么你所需要的内容自动地就会呈现出来。而这一部分也是整个数据挖掘里最难的部分。

比如说我们的微博数据，我们可以通过决策树算法建立模型。最后输出那些关健字的客户就是我们的目标客户。又或者，我们可以通过神经网络的算法建立模型，找到相关的所的决策项。实际上，数据挖掘所用到的方法很多，也很复杂，我也是到现在还是没有弄清楚一些算法的核心思想。但这样并不影响我们来使用相关的算法来进行挖掘。再者说，现在的挖掘对象，真正上PB内容的资料也不是很多的。很多企业还停留在小型机的阶段。所以，有的时候，我会开玩笑的说：数据量太小的话，EXECL会更好一些，然后是ACCESS数据库。再然后就是ORCALE数据库.....

模型建立是一个比较幸苦的工作，可是如果建立完成后，一般3-5年不会发生变化。比如我们现在的信用卡的信用评分系统。

模型评估

这一部分内容，是进行相关优化。也就是说模型建立好了，开始要跑业务了。要测试一下看它到底能跑到什么样的程度。有的时候，你挖掘了半年，也找到的目标客户，结果被其他人先用其他方法吸引走了，怎么办？所以才要有模型评估这件工作。

先将大数据里的一部分数据，一般是40%拿来先做训练，你也可以拿少量来试一试。然后看完成这些数据需要多长时间。换了其他的算法后，是否可以提高挖掘时间。一般这一步的数据分配要遵守一个4:3:3的原则，即40%拿来做训练，30%来做测试，另外的30%拿来做验证。综合来说，才能够评价这个模型的好坏，以及这个模型是否能产生它的相应价值。

发布模型

这是最后一步，让所有微博数据进行相应的算法优化。进而达到最好的挖掘效果。

在以上的这几个步骤中，模型评估与商业理解其实也是相辅相成的，因为这两个主要是与数据最为密切。而数据理解与商业理解又是相互制约的，很多时候，我们是有了大数据，但是我们找不到我们的所要挖掘的目标在那里，这时就需要不断的修订我们的商业理解与数据理解，然而，模型的相关内容，在整个闭环的过程中并不显的那么重要。有的时候，客户的一个很简单的需求，我们并不一定要用复杂的技术来实现，简单也许就意味着胜利。

再来说说在文本挖掘中的思路，少量的文本信息。我们可以放在在WORD里用复制粘贴来完成，多的话可以用EXCEL，再多的话可以用U1，要是还是多就用SAS与R，再多就用其他的了，具体什么软件，我也没用过。

好了，就先总结这么多吧。下周有空再写吧！

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

MySQL : 초보자가 마스터하는 필수 기술Apr 18, 2025 am 12:24 AM

MySQL은 초보자가 데이터베이스 기술을 배우는 데 적합합니다. 1. MySQL 서버 및 클라이언트 도구를 설치하십시오. 2. SELECT와 같은 기본 SQL 쿼리를 이해하십시오. 3. 마스터 데이터 작업 : 데이터를 만들고, 삽입, 업데이트 및 삭제합니다. 4. 고급 기술 배우기 : 하위 쿼리 및 창 함수. 5. 디버깅 및 최적화 : 구문 확인, 인덱스 사용, 선택*을 피하고 제한을 사용하십시오.

MySQL : 구조화 된 데이터 및 관계형 데이터베이스Apr 18, 2025 am 12:22 AM

MySQL은 테이블 구조 및 SQL 쿼리를 통해 구조화 된 데이터를 효율적으로 관리하고 외래 키를 통해 테이블 간 관계를 구현합니다. 1. 테이블을 만들 때 데이터 형식을 정의하고 입력하십시오. 2. 외래 키를 사용하여 테이블 간의 관계를 설정하십시오. 3. 인덱싱 및 쿼리 최적화를 통해 성능을 향상시킵니다. 4. 데이터 보안 및 성능 최적화를 보장하기 위해 데이터베이스를 정기적으로 백업 및 모니터링합니다.

MySQL : 주요 기능 및 기능이 설명되었습니다Apr 18, 2025 am 12:17 AM

MySQL은 웹 개발에 널리 사용되는 오픈 소스 관계형 데이터베이스 관리 시스템입니다. 주요 기능에는 다음이 포함됩니다. 1. 다른 시나리오에 적합한 InnoDB 및 MyISAM과 같은 여러 스토리지 엔진을 지원합니다. 2.로드 밸런싱 및 데이터 백업을 용이하게하기 위해 마스터 슬레이브 복제 기능을 제공합니다. 3. 쿼리 최적화 및 색인 사용을 통해 쿼리 효율성을 향상시킵니다.

SQL의 목적 : MySQL 데이터베이스와 상호 작용합니다Apr 18, 2025 am 12:12 AM

SQL은 MySQL 데이터베이스와 상호 작용하여 데이터 첨가, 삭제, 수정, 검사 및 데이터베이스 설계를 실현하는 데 사용됩니다. 1) SQL은 Select, Insert, Update, Delete 문을 통해 데이터 작업을 수행합니다. 2) 데이터베이스 설계 및 관리에 대한 생성, 변경, 삭제 문을 사용하십시오. 3) 복잡한 쿼리 및 데이터 분석은 SQL을 통해 구현되어 비즈니스 의사 결정 효율성을 향상시킵니다.

초보자를위한 MySQL : 데이터베이스 관리를 시작합니다Apr 18, 2025 am 12:10 AM

MySQL의 기본 작업에는 데이터베이스, 테이블 작성 및 SQL을 사용하여 데이터에서 CRUD 작업을 수행하는 것이 포함됩니다. 1. 데이터베이스 생성 : createAbasemy_first_db; 2. 테이블 만들기 : CreateTableBooks (idintauto_incrementprimarykey, titlevarchar (100) notnull, authorvarchar (100) notnull, published_yearint); 3. 데이터 삽입 : InsertIntobooks (Title, Author, Published_year) VA

MySQL의 역할 : 웹 응용 프로그램의 데이터베이스Apr 17, 2025 am 12:23 AM

웹 응용 프로그램에서 MySQL의 주요 역할은 데이터를 저장하고 관리하는 것입니다. 1. MySQL은 사용자 정보, 제품 카탈로그, 트랜잭션 레코드 및 기타 데이터를 효율적으로 처리합니다. 2. SQL 쿼리를 통해 개발자는 데이터베이스에서 정보를 추출하여 동적 컨텐츠를 생성 할 수 있습니다. 3.mysql은 클라이언트-서버 모델을 기반으로 작동하여 허용 가능한 쿼리 속도를 보장합니다.

MySQL : 첫 번째 데이터베이스 구축Apr 17, 2025 am 12:22 AM

MySQL 데이터베이스를 구축하는 단계에는 다음이 포함됩니다. 1. 데이터베이스 및 테이블 작성, 2. 데이터 삽입 및 3. 쿼리를 수행하십시오. 먼저 CreateAbase 및 CreateTable 문을 사용하여 데이터베이스 및 테이블을 작성한 다음 InsertInto 문을 사용하여 데이터를 삽입 한 다음 최종적으로 SELECT 문을 사용하여 데이터를 쿼리하십시오.

MySQL : 데이터 저장에 대한 초보자 친화적 인 접근 방식Apr 17, 2025 am 12:21 AM

MySQL은 사용하기 쉽고 강력하기 때문에 초보자에게 적합합니다. 1.MySQL은 관계형 데이터베이스이며 CRUD 작업에 SQL을 사용합니다. 2. 설치가 간단하고 루트 사용자 비밀번호를 구성해야합니다. 3. 삽입, 업데이트, 삭제 및 선택하여 데이터 작업을 수행하십시오. 4. Orderby, Where and Join은 복잡한 쿼리에 사용될 수 있습니다. 5. 디버깅은 구문을 확인하고 쿼리를 분석하기 위해 설명을 사용해야합니다. 6. 최적화 제안에는 인덱스 사용, 올바른 데이터 유형 선택 및 우수한 프로그래밍 습관이 포함됩니다.

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.