第 7 回国勢調査公報を読むと、作業プロセス全体が企業のデータ分析プロセスと似ていることがわかります。本稿では、まず両者の共通点を見て、次にインターネット実務家として「七人国勢調査」のどのような情報に注目すべきかを考えてみたい。
「第7回国勢調査公報」を参考に解説しています
です。国勢調査の内容や調査方法を工夫します。電子データ収集方法が完全に採用されており、調査員は電子機器を使用してデータを直接リアルタイムで収集および報告します。企業に対応する変換および報告は、
埋没点報告
埋められたポイントを理解するにはどうすればよいですか? 「ポイント」とは実際にはアプリやウェブサイト上の特定の場所です。埋められたポイントは特定の場所にあり、ユーザーが特定のアクションをとった後、ユーザーの現在の情報が記録されます。アクションには、閲覧、クリック、スワイプなどが含まれます。例:電子商取引アプリでは、ユーザーが注文ボタンをクリックすると、注文の時刻、金額、商品ID、モバイルネットワークの状態、モバイルOSなどの情報が記録されますが、これが隠れたポイントです。埋葬ポイントにはあらゆる情報を記録できますが、重要な情報は時間、場所、人物の 3 つです。時間は動作が発生した時間であり、ユーザーのタイミングを分析するために使用されます。場所は、動作が発生した現在のページ上の特定の場所です。文字はユーザー ID であり、通常は携帯電話や PC からのデバイス情報を使用して生成されます。その他の情報は、データ分析のニーズに基づいて選択的に収集されます。
情報は収集された後、通常、その後の分析のためにリアルタイム テクノロジを通じて企業のサーバーにレポートされます。これらの埋もれたポイントをもとに、ユーザーがいつどのコンテンツを閲覧したのか、最後にどのコンテンツをクリックしたのか、クリックしたコンテンツをどのくらいの時間視聴したのか、最終的に何を購入したのか、いくら使ったのかなどを分析し、さらに分析することができます。さらにパーソナライズされた推奨を行うために、ユーザーのどのコンテンツが好まれているか、ユーザーの購買力はどれくらいかを分析します。
インターネット クラウド テクノロジー、クラウド サービス、クラウド アプリケーションを最大限に活用してデータ処理作業を完了します。
大量のデータが埋もれており、長期間のデータ処理が必要なため、定期保管。したがって、企業の埋もれたポイントが報告された後、それらは分散ストレージメディアに保存されるのが一般的であり、その後のデータ分析作業は主に分散コンピューティングフレームワークを使用して処理されます。分散ストレージおよびコンピューティング サービスは現在、ほとんどがクラウド サービスの形式をとっています。私が働いていた会社は、もともと分散サービスを構築するために独自のサーバーを購入していましたが、運用保守コストが高すぎて耐えられなかったため、最終的に Alibaba Cloud に移行し、運用保守コストのかなりの部分を節約しました。 分散ストレージおよびコンピューティング フレームワークは、Hadoop、Hive、Spark などのオープンソースにすることも、Alibaba Cloud の MaxCompute などの企業が自社開発することもできます。
# 国民の個人情報のセキュリティを確保するため、国家ネットワーク セキュリティ レベル 3 の保護基準に従って国勢調査データの収集、送信、保管を安全に管理します
# #この部分の内容
個人情報保護、企業内では、ID 番号などのユーザーの機密情報は機密情報が制限されます。つまり、ID 番号は一意の識別子にエンコードされるため、使用に影響を与えたり、個人情報が漏洩したりすることがあります。 非感作に加えて、データの機密性を分類し、対応する権限レビューメカニズムを確立することも必要です。どのレベルの機密データが使用されたかは、対応する許可を申請し、情報漏洩を追跡できるように記録する必要があります。
あらゆるレベルの国勢調査機関は、品質管理要件を厳格に実装し、品質検査を慎重に実施して、国勢調査のすべての段階での作業の品質を保証します
この部分では、次について説明します。
データ品質の監視。企業においては、埋め込みポイントの品質監視も重要な要素ですが、報告された埋め込みポイントがすべて間違っていて使用できなければ、明らかに意味がありません。 企業による埋め込みポイントの品質監視は、一般に 2 つの側面で行われます。まず、単一の埋め込みポイントの検証、報告された埋め込みポイントの各フィールドの形式が正しいかどうかのチェック、埋め込みポイントの null 値率の監視です。コア分野など。次に、交通量を監視し、報告された埋没地点の規模に異常がないかを前年比比較して判断します。
第7回国勢調査は、我が国の人口の数、構造、分布等を総合的に調査し、人口変動の傾向特性を把握することにより、我が国の人口開発戦略及び人口開発戦略を改善するための基礎を提供するものです。政策体系と策定 経済社会開発計画の策定と質の高い経済発展の促進をサポートする正確な統計情報を提供します。
この部分は、私たちがよく知っている
データ分析です。企業では、ユーザーの行動を分析し、貴重な結論を得て、繰り返しの意思決定サポートを提供します。アプリまたはウェブサイト。 データ分析は通常 2 つの部分に分かれています。1 つの部分は数値分析であり、単純な数値統計を行うことも、Python 機械学習を使用してフィッティングや分類などを行うこともできます。データ量が多い場合には、分散コンピューティング フレームワークである Hadoop や Spark が使用されます。もう 1 つの部分はテキスト分析です。これは、数値分析では見えないものをマイニングするために、より多くの機械学習と深層学習の手法を使用します。
また、何か追加します。国勢調査で確認される年齢、性別、学歴、その他の情報は、一般に企業では ユーザー ポートレート と呼ばれます。この情報は埋設ポイントから収集することはできませんが、企業にとって非常に重要なデータであり、多くの場合、ユーザーの行動と組み合わせて、機械学習や深層学習アルゴリズムを使用して予測する必要があります。
前編はここまでです。国勢調査を例に、企業データ分析のプロセスとそれに関連するテクノロジを紹介します。インターネット実務者としてどのような点に注意すべきかについて簡単に説明しましょう。
人口の質は向上し続けており、人材の配当における新たな利点が徐々に現れるでしょう。同時に、大学生の就職圧力は高まっており、産業の変革と高度化のペースを加速する必要があります。
ホワイトカラー人口は長い間供給過剰であり、996 革命は今後も激化するでしょう。そのため、ハイテク企業の人材コストは削減され、「人材」は配当優位性が徐々に現れてきました。」
鍛冶に関しては、やはり勤勉である必要があり、実際のスキルと学習を継続的に向上させる必要があります。
人口集積の加速は、都市化と経済集積の傾向変化を反映しているだけでなく、都市化の質の向上と協調的な地域開発の促進に対する新たな要件も提起しています。
大都市への人口流入が加速する一方で、地方の人口減少も加速しています。
中国の都市化プロセスはまだ完了していないため、まだ卒業していない学生にとっては、一線都市および新しい一線都市を選択するのが賢明な選択です。すでに大都市に住んでいる出稼ぎ労働者にとって、中心部に家を購入するのは賢明な選択です。
高齢者人口の割合は急速に増加しており、高齢化は今後しばらくの間、我が国の基本的な国家条件となるでしょう。同時に、高齢者人口の増加は、知恵、継承、性能、需要の拡大ももたらします。
退職を遅らせる準備をする 中年の危機だけでなく、老後の危機も考慮する必要があるようです。
企業は、一日中何もせずに大量の役に立たないデータを分析することはありません。国勢調査も同様で、自分にとって有益な情報を見つけて、将来どう進むべきかを考えることは、誰もが最もすべきことです。
関連する推奨事項: