recherche
Maisonbase de donnéestutoriel mysqlApacheHive一点一点进步(1) 简单介绍

Hive是一个 hadoop 的数据仓库,便于对 hadoop 中存储的大数据进行数据汇总,点对点查询,以及分析。 Hive提供了一套管理机制用于管理HDFS中的数据及一套类型于sql的查询语言HiveQL。 同时当HiveQL无法满足逻辑的时候,这种语言支持传统的MR程序,以插件的形

Hive是一个hadoop的数据仓库,便于对hadoop中存储的大数据进行数据汇总,点对点查询,以及分析。

Hive提供了一套管理机制用于管理HDFS中的数据及一套类型于sql的查询语言HiveQL。

同时当HiveQL无法满足逻辑的时候,这种语言支持传统的MR程序,以插件的形式集成到Hive的MR中。

Hive是apache基金会下的一个开源志愿者项目。以前他是一个Hadoop的子项目。但是现在他已经升级为一个顶级项目。

安装

Requirements Java1.6,hadoop0.20.xx选择一个稳定版进行安装 http://hive.apache.org/releases.html解压缩tarball。$ tar -xzvf hive-x.y.z.tar.gz$ cd hive-x.y.z  $ export HIVE_HOME={{pwd}}

配置 Hive默认的配置是<install-dir>/conf/hive-DEFAULT.xml如果需要变更配置,可以重新配置于 <install-dir>/conf/hive-site.xmlLog4j配置储存于<install-dir>/conf/hive-log4j.propertiesHive的配置是基于对hadoop的一个覆盖,意思是hadoop的配置变量是缺省继承的。Hive变量的配置方法:1.修改hive-site.xml文件2.通过cli客户端使用SET命令进行3.通过授权hive使用如下语法$ bin/hive -hiveconf x1=y1 -hiveconf x2=y2</install-dir></install-dir></install-dir>

运行时配置

Hive的查询是通过MR查询执行的,因此,这样的查询行为都是被hadoop的配置变量进行控制的。hive> SET mapred.job.tracker=myhost.mycompany.com:50030;hive> SET -v;上面的最后一条语句可以显示当前的所有配置。如果不加-v参数,则只显示与基础的hadoop配置不同的配置。

Local模式

hive> SET mapred.job.tracker=LOCAL;hive> SET hive.EXEC.mode.LOCAL.auto=FALSE;$ export PATH=$HIVE_HOME/bin:$PATH

修改Log路径

bin/hive -hiveconf hive.root.logger=INFO,consolebin/hive -hiveconf hive.root.logger=INFO,DRFAMETASTOREmodel描述文件位置:src/contrib/hive/metastore/src/modelDML Operations默认的文件分割呼号是ctr+a文件上传的默认目录是: hive-DEFAULT.xml 中的hive.metastore.warehouse.dir上传文件的两种方式:本地文件LOAD DATA LOCAL INPATH './examples/files/kv2.txt' OVERWRITE INTO TABLE invites PARTITION (ds='2008-08-15');远程文件 LOAD DATA INPATH '/user/myname/kv2.txt' OVERWRITE INTO TABLE invites PARTITION (ds='2008-08-15');上面的命令会发生文件和目录的转移。将结果插入到HDFS INSERT OVERWRITE DIRECTORY '/tmp/hdfs_out' SELECT a.* FROM invites a WHERE a.ds='2008-08-15';将结果插入到本地文件INSERT OVERWRITE LOCAL DIRECTORY '/tmp/local_out' SELECT a.* FROM pokes a;

只定义mapper任务:py

import sysimport datetimeFOR line IN sys.stdin:  line = line.strip()  userid, movieid, rating, unixtime = line.split('\t')    weekday = datetime.datetime.fromtimestamp(FLOAT(unixtime)).isoweekday()    print '\t'.JOIN([userid, movieid, rating, str(weekday)])CREATE TABLE u_data_new (  userid INT,  movieid INT,  rating INT,  weekday INT)ROW FORMAT DELIMITEDFIELDS TERMINATED BY '\t';ADD FILE weekday_mapper.py;INSERT OVERWRITE TABLE u_data_newSELECT  TRANSFORM (userid, movieid, rating, unixtime)  USING 'python weekday_mapper.py'  AS (userid, movieid, rating, weekday)FROM u_data;SELECT weekday, COUNT(*)FROM u_data_newGROUP BY weekday;
Déclaration
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Quels sont les outils que vous pouvez utiliser pour surveiller les performances MySQL?Quels sont les outils que vous pouvez utiliser pour surveiller les performances MySQL?Apr 23, 2025 am 12:21 AM

Comment surveiller efficacement les performances MySQL? Utilisez des outils tels que MySqladmin, ShowGlobalStatus, Perconamonitoring and Management (PMM) et MySQL EnterpriMeitor. 1. Utilisez MySqladmin pour afficher le nombre de connexions. 2. Utilisez ShowGlobalStatus pour afficher le numéro de requête. 3.PMM fournit des données de performances détaillées et une interface graphique. 4.MySQLenterPrisemonitor fournit des fonctions de surveillance et des mécanismes d'alarme riches.

En quoi MySQL diffère-t-il de SQL Server?En quoi MySQL diffère-t-il de SQL Server?Apr 23, 2025 am 12:20 AM

La différence entre MySQL et SQLServer est: 1) MySQL est open source et adapté aux systèmes Web et intégrés, 2) SQLServer est un produit commercial de Microsoft et convient aux applications au niveau de l'entreprise. Il existe des différences significatives entre les deux dans le moteur de stockage, l'optimisation des performances et les scénarios d'application. Lors du choix, vous devez considérer la taille du projet et l'évolutivité future.

Dans quels scénarios pourriez-vous choisir SQL Server via MySQL?Dans quels scénarios pourriez-vous choisir SQL Server via MySQL?Apr 23, 2025 am 12:20 AM

Dans les scénarios d'application au niveau de l'entreprise qui nécessitent une haute disponibilité, une sécurité avancée et une bonne intégration, SQLServer doit être choisi au lieu de MySQL. 1) SQLServer fournit des fonctionnalités de niveau d'entreprise telles que la haute disponibilité et la sécurité avancée. 2) Il est étroitement intégré aux écosystèmes Microsoft tels que VisualStudio et PowerBI. 3) SQLServer fonctionne excellent dans l'optimisation des performances et prend en charge les tables optimisées par la mémoire et les index de stockage de colonnes.

Comment MySQL gère-t-il les ensembles de caractères et les collations?Comment MySQL gère-t-il les ensembles de caractères et les collations?Apr 23, 2025 am 12:19 AM

MySqlManagesCharAttetsEtsAndCollationsByusingUtf-8AstheDefault, permettant à la configuration dedata

Que sont les déclencheurs dans MySQL?Que sont les déclencheurs dans MySQL?Apr 23, 2025 am 12:11 AM

Un déclencheur MySQL est une procédure stockée automatiquement exécutée associée à une table qui est utilisée pour effectuer une série d'opérations lorsqu'une opération de données spécifique est effectuée. 1) Définition et fonction de déclenchement: utilisé pour la vérification des données, la journalisation, etc. 2) Principe de travail: il est divisé en avant et après et prend en charge le déclenchement au niveau des lignes. 3) Exemple d'utilisation: peut être utilisé pour enregistrer les modifications de salaire ou mettre à jour l'inventaire. 4) Compétences de débogage: utilisez des commandes ShowTriggers et ShowCreateTrigger. 5) Optimisation des performances: Évitez les opérations complexes, utilisez des index et gérez les transactions.

Comment créez-vous et gérez-vous les comptes d'utilisateurs dans MySQL?Comment créez-vous et gérez-vous les comptes d'utilisateurs dans MySQL?Apr 22, 2025 pm 06:05 PM

Les étapes pour créer et gérer les comptes d'utilisateurs dans MySQL sont les suivants: 1. Créez un utilisateur: utilisez CreateUser'NewUser '@' localHost'IdentifiedBy'Password '; 2. Attribuez des autorisations: utilisez GRANSELECT, INSERT, UPDATEONMYDATABASE.TO'NEWUSER'@'LOCALHOST '; 3. Correction de l'erreur d'autorisation: Utilisez Revokeallprivilegesonmydatabase.from'newuser'@'localhost '; puis réaffectez les autorisations; 4. Autorisations d'optimisation: utilisez Showgra

En quoi MySQL diffère-t-il d'Oracle?En quoi MySQL diffère-t-il d'Oracle?Apr 22, 2025 pm 05:57 PM

MySQL convient au développement rapide et aux applications petites et moyennes, tandis qu'Oracle convient aux grandes entreprises et aux besoins à haute disponibilité. 1) MySQL est open source et facile à utiliser, adapté aux applications Web et aux petites et moyennes entreprises. 2) Oracle est puissant et adapté aux grandes entreprises et aux agences gouvernementales. 3) MySQL prend en charge une variété de moteurs de stockage, et Oracle offre des fonctions riches de niveau d'entreprise.

Quels sont les inconvénients de l'utilisation de MySQL par rapport aux autres bases de données relationnelles?Quels sont les inconvénients de l'utilisation de MySQL par rapport aux autres bases de données relationnelles?Apr 22, 2025 pm 05:49 PM

Les inconvénients de MySQL par rapport à d'autres bases de données relationnelles incluent: 1. Problèmes de performances: Vous pouvez rencontrer des goulots d'étranglement lors du traitement des données à grande échelle, et PostgreSQL fonctionne mieux dans les requêtes complexes et le traitement des mégadonnées. 2. Évolutivité: la capacité de mise à l'échelle horizontale n'est pas aussi bonne que Google Spanner et Amazon Aurora. 3. Limites fonctionnelles: pas aussi bonnes que PostgreSQL et Oracle dans les fonctions avancées, certaines fonctions nécessitent plus de code et de maintenance personnalisés.

See all articles

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Outils chauds

MantisBT

MantisBT

Mantis est un outil Web de suivi des défauts facile à déployer, conçu pour faciliter le suivi des défauts des produits. Cela nécessite PHP, MySQL et un serveur Web. Découvrez nos services de démonstration et d'hébergement.

Adaptateur de serveur SAP NetWeaver pour Eclipse

Adaptateur de serveur SAP NetWeaver pour Eclipse

Intégrez Eclipse au serveur d'applications SAP NetWeaver.

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

Puissant environnement de développement intégré PHP

VSCode Windows 64 bits Télécharger

VSCode Windows 64 bits Télécharger

Un éditeur IDE gratuit et puissant lancé par Microsoft

SublimeText3 Linux nouvelle version

SublimeText3 Linux nouvelle version

Dernière version de SublimeText3 Linux