효과적인 데이터 분석을 수행하는 방법-일반적인 문제-php.cn

집

일반적인 문제

효과적인 데이터 분석을 수행하는 방법

angryTom

Jul 22, 2019 am 11:44 AM

빅데이터

효과적인 데이터 분석을 수행하는 방법

추천 튜토리얼: Python 튜토리얼

인터넷 후반부, 지속적인 개선 작업을 배경으로 제품 관리자는 더 이상 단순히 감정에 의존하여 제품을 만드는 것이 아니라, 데이터 인식을 배양하고, 데이터를 기반으로 지속적으로 제품을 개선할 수 있습니다.

회사의 전문 데이터 분석가와 달리 제품 관리자는 사용자 및 비즈니스 수준에서 더 많은 데이터를 확인하여 데이터 변경 이유를 더 빠르고 철저하게 찾을 수 있습니다.

그렇다면 데이터가 효과적으로 기록되었다는 전제하에 어떻게 데이터를 효과적으로 분석할 수 있을까요?

1. 데이터 분석 목적을 명확히 한다

1. 데이터 분석의 목적이 개정 전과 개정 후 페이지의 장단점을 비교하는 것이라면 측정된 지표는 클릭부터 시작해야 한다 - 페이지 통과율, 이탈률 및 기타 측면에서 전자상거래 애플리케이션은 주문 전환율도 관찰해야 하며, 소셜 애플리케이션은 사용자의 방문 시간, 좋아요 빈도 및 전달 상호작용 등에 주의를 기울여야 합니다.

많은 신규 사용자가 자신의 제품을 디자인할 때 제품 자체의 디자인에 많은 시간을 할애할 수 있지만 제품의 성공을 측정하는 방법에 대해 생각하는 데 에너지를 소비하지 않습니다. "사용자. '개선'에 대한 빈말은 제품 디자인 요구사항 검토를 원활하게 통과하는 데 도움이 되지 않으며, 제품의 KPI 지표를 신속하게 효과적으로 개선할 수도 없습니다.

　　2. 데이터 분석의 목적이 특정 모듈의 비정상적인 데이터 변동 원인을 탐색하는 것이라면 분석 방법은 버전->시간->군중의 피라미드 원리에 따라 점진적으로 해체되어야 합니다.

예를 들어, 최근 홈페이지의 Guess You Like 모듈의 클릭률이 40%에서 35%로, 5%포인트 급락한 것을 발견했다면, 이때 먼저 어떤 버전이 변동되었는지, 새 버전이 온라인 상태인지, 누락된 포인트나 오류로 인해 발생했는지.

버전 변동 데이터가 일관되게 유지된다면 데이터가 언제 변경되기 시작했는지 살펴보세요. 크리스마스와 설날 휴일 요인 때문일까요? 페이지의 다른 모듈에서 전환과 같은 새로운 활동이 시작되었습니다. .

그렇지 않다면 세분화하여 트래픽 소스의 구성이 변경되었는지, 신규 사용자 노출 증가로 인한 것인지 살펴보세요.

제품 관리자는 명확한 목적을 가지고 데이터를 분석하고, 목표 달성을 위해 검증하기 위해 어떤 차원을 구성해야 하는지 생각해야 합니다. 대부분의 경우 제품 관리자는 인내심을 갖고 단계적으로 하위 구분을 해체하여 이유를 조사해야 합니다.

2. 여러 채널을 통한 데이터 수집

일반적으로 수집 채널은 4가지 유형이 있습니다.

　　1. Analysys나 iResearch 등 외부 업계 데이터 분석 보고서에서 얻은 데이터, 신중한 태도로 데이터를 관찰하고, 효과적이고 정확한 정보를 추출하고, 물에 잠길 수 있는 일부 데이터를 떼어내고 경계해야 합니다. 항상 다른 사람이 처리한 2차 데이터입니다.

　　2. AppStore, 고객 서비스 피드백, Weibo 및 기타 커뮤니티 포럼에서 사용자 피드백을 적극적으로 수집합니다. 저는 시간이 나면 커뮤니티 포럼에 가서 사용자의 상태 댓글을 자주 읽습니다. 일반적으로 이러한 댓글은 매우 좋거나 꾸짖는 등 매우 극단적이지만 이러한 댓글은 여전히 내 제품 디자인 개선에 매우 유익합니다. 네, 그 순간 사용자가 왜 그런 감정을 느꼈는지 추론해 볼 수 있습니다.

　　3. 설문지 디자인, 사용자 인터뷰, 기타 설문조사에 직접 참여하고, 사용자와 직접 대면하며, 직접 데이터를 수집하고, 사용자가 제품을 사용할 때 겪는 문제와 감정을 관찰합니다. 설문지는 핵심 질문을 다듬고 질문 수를 줄여야 하며, 재활용 결과는 비효과적이고 형식적인 설문지를 제거해야 합니다. 사용자 인터뷰에서는 유도적인 단어나 질문을 사용하여 사용자의 자연스러운 감정을 편향시키지 않도록 주의해야 합니다.

　　4. 기록된 사용자 행동 궤적에서 데이터를 연구합니다. 대기업은 일반적으로 온라인 사용자 데이터에 대한 일일 또는 실시간 피드백을 제공하기 위해 고정 회선 보고서/이메일을 보유하고 있습니다. 또한 제품 관리자나 데이터 분석가에게 SQL 쿼리 플랫폼을 제공하여 보다 심층적으로 데이터를 탐색하고 비교할 수 있습니다. 방법.

3. 간섭 데이터를 효과적으로 제거합니다

　1. 올바른 샘플 수를 선택하고, 충분히 큰 수를 선택하고, 극단적이거나 우발적인 데이터의 영향을 제거합니다. 2008년 올림픽에서 야오밍의 3점슛 성공률은 100%였고, 고베의 3점슛 성공률은 32%였습니다. 그렇다면 야오밍의 3점슛 성공률이 고베보다 높았다는 뜻인가요? 디스플레이에 문제가 있습니다. 그 올림픽에서 야오밍이 3점슛을 1개만 쐈고 코비는 53개를 쐈거든요.

　　2. 분석 결론의 편향을 줄이기 위해 동일한 샘플링 규칙을 개발하세요. 예를 들어 푸시 카피라이팅 두 개, 첫 번째는 "당신이 아직 받지 못한 마음이 따뜻해지는 테이크아웃 빨간 봉투를 가지고 있습니다. 가장 큰 빨간 봉투는 밥을 제일 잘 먹는 당신만을 위한 것입니다. 클릭해서 들어가세요", 두 번째는 "집 밖으로 나가지 않고도 테이크아웃 저온혜택을 드려요." 가족들이 따뜻하고 맛있는 음식을 즐길 수 있으니 클릭해서 모아보세요. 실험 데이터에 따르면 두 번째 푸시 카피의 클릭률은 첫 번째 푸시 카피의 클릭률보다 30% 더 높았습니다. 그렇다면 정말 두 번째 카피가 더 매력적인 걸까요? 두 번째 푸시 사본 수신자의 활동이 첫 번째 푸시 사본의 수신자 활동보다 훨씬 높은 것으로 나타났습니다.

　　3. 버전 간섭이나 휴일 요인을 제외하면 새 버전의 데이터 성능은 처음 출시될 때 매우 좋은 경우가 많습니다. 왜냐하면 적극적으로 업그레이드하는 사용자는 일반적으로 활동량이 많은 사용자이기 때문입니다. 주말이나 주요 공휴일이 가까워지면 사용자의 소비 욕구가 촉발되고 전자상거래 애플리케이션의 주문 전환율도 급격하게 높아집니다. 따라서 데이터를 비교할 때 실험군과 대조군의 데이터는 시간 차원에서 일관성을 유지해야 한다.

　　4. 과거 데이터는 잊어버리세요. 인간은 데이터 기술과 다르다. 데이터 기술은 100% 기억 능력을 갖고 있는 반면, 인간은 아호빈스의 망각의 법칙에 따라 1일 후 33%, 6일 후 25%, 31일 후 21%만 기억할 수 있다. 그러므로 심사기간을 합리적으로 선택해야 합니다. 예를 들어 Guess You Like 모듈은 관심 태그 점수에 특정 가중치 프로세스를 수행할 뿐만 아니라 제품의 수명주기와 같은 요소를 기반으로 일련의 회귀 실험을 수행하여 청중의 다양한 감소 곡선을 얻습니다. 관심분야 및 구매 경향에 따라 정기적인 시간 변경을 통해 오래된 데이터를 효과적으로 삭제하여 모듈의 클릭률을 높입니다.

　5. 실험은 A1 그룹을 분할해야 합니다. 즉, 실험 그룹 B와 통제 그룹 A에 또 다른 그룹 A1을 추가해야 합니다. A1과 A의 규칙은 일관되어야 하며, 이후 데이터 변동을 탐색해야 합니다. AB를 AA1과 비교하여 데이터의 자연적/비정상적 변동의 영향을 제거합니다. 나의 실제 A/B 실험은 A1 그룹을 설정하는 것이 매우 중요하고 필요하다는 것을 보여줍니다. 데이터 규모가 아무리 크더라도 동일한 실험 규칙을 사용하는 두 그룹의 데이터에도 약간의 변동이 있을 것입니다. 작은 변동은 정제에 있습니다. 오늘의 작업에서 우리의 판단은 크게 혼란스럽고 편향될 수 있습니다.

넷. 합리적이고 객관적으로 데이터를 검토하세요

　1. 침묵하는 사용자를 무시하지 마세요

제품 관리자는 일부 사용자의 피드백을 듣고 많은 시간을 개발에 소비합니다. 응답 기능은 대부분의 사용자가 신경 쓰지 않는 반면 매우 소수의 사용자에게 긴급한 요구 사항인 경우가 많습니다. 이는 핵심 사용자의 요구에 반하여 제품의 새 버전이 출시된 후 데이터가 급락하는 원인이 될 수도 있습니다.

침묵적인 사용자를 무시하고 제품을 사용하는 대부분의 대상 사용자의 핵심 요구 사항을 종합적으로 고려하지 않으면 인력 및 물적 자원이 낭비될 수 있으며 더 나아가 비즈니스 기회를 놓칠 수도 있습니다.

　 2. 데이터 결과를 종합적으로 이해하세요

실험 결과에 대한 기대와 우리의 경험적 지식 사이에 큰 차이가 있는 경우, 맹목적으로 결론을 내리거나 직관에 의문을 제기하지 말고 실행해 보시기 바랍니다. 데이터 분석을 더욱 철저하게 분석합니다.

예를 들어 홈페이지에서 사용자에게 활성 팝업을 전달하는 실험을 한 적이 있는데, 홈페이지 클릭률 측면에서 실험군의 데이터가 대조군을 훨씬 능가하는 것으로 나타났습니다. 전환율은 물론, 7일 유지율까지.. 각 모듈의 전환율이 기대 이상으로 크게 향상되었습니다. 그렇다면 이것이 정말 사용자의 전환율을 자극하는 활성 팝업일까요?

나중에 우리는 홈페이지에 활성 팝업을 표시할 수 있는 사용자는 Wi-Fi 환경과 같이 사용하는 환경에서 네트워크 상태가 더 좋은 경우가 많은 반면, 팝업을 표시하지 않는 사용자는 버스/지하철/상점 기타 모바일 시나리오에서는 네트워크 통신이 좋지 않아 A/B 실험 결과에 영향을 미칠 수 있습니다.

3. 데이터에 너무 의존하지 마세요

데이터에 대한 지나친 의존은 우리가 쓸모없는 데이터 분석을 많이 하게 만들고, 다른 한편으로는 제한을 가하게 됩니다. 제품 관리자가 가져야 할 영감과 창의성 .

Luo Zhenyu가 Friends of Time의 새해 전야 연설에서 언급한 것과 정확히 같습니다. 사용자가 원하는 것을 무엇이든 제공합니다. 이를 모성애 알고리즘이라고 합니다. 그러나 모성애 알고리즘에는 큰 단점이 있습니다. 추천 시간이 지날수록 점점 좁아지겠죠.

반대편에는 높이 서서 멀리 보는 아버지 사랑의 알고리즘이 있습니다. 사용자들에게 쓰레기를 손에 내려 놓고 좋은 소식을 알려 드리겠습니다. 나를 따르십시오. 당시 Qiao Bangzhu가 만든 iPhone 시리즈 제품처럼 그는 사용자의 기대를 뛰어넘는 제품을 만들기 위해 시장 분석을 살펴보거나 사용자 조사를 수행하지 않았습니다.

5. 개요

미국에서 가장 성공적인 동영상 웹사이트인 Netflix는 사용자 습관 기반 분석을 통해 영화 제작 과정에 빅데이터 분석을 통합하여 인기 미국 드라마 "House of of"를 탄생시켰습니다. 카드". 하지만 넷플릭스 직원들은 우리에게 빅데이터에 집착하면 안 된다고 하더군요

9점짜리 TV 시리즈가 고품질 상품으로 평가된다면 빅데이터는 6점이라는 낮은 점수의 위험으로부터 우리를 구할 수 있습니다. 이하이지만 단계적으로 우리를 평범하게 만들 것입니다. 대다수는 7-8 사이의 점수를 얻습니다.

위 내용은 효과적인 데이터 분석을 수행하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.