infiniDB在linux下完成倒库-mysql教程-PHP中文网

首页

数据库

mysql教程

infiniDB在linux下完成倒库

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 03:23 PM

linux完成

infiniDB列式数据库，查询速度快。但维护速度慢，增删改特别慢，不适合大数据量操作。在mysql，大数据量查询慢，但维度快（增删改快）。方案，mysql下，入库每天的数据，按天处理和维护数据。导入infiniDB 一，连接数据库：Navicat连接。建立mysql和infin

infiniDB列式数据库，查询速度快。但维护速度慢，增删改特别慢，不适合大数据量操作。

在mysql，大数据量查询慢，但维度快（增删改快）。

方案，mysql下，入库每天的数据，按天处理和维护数据。导入infiniDB

一，连接数据库：Navicat连接。建立mysql和infiniDB的数据表结构。

mysql数据由kettle导入，并完成相关逻辑处理，如去重，去空等（复杂按经验分析）。

二，本机mysql倒出表

用kettle设计一个自动化部署，将mysql数据表导出成tbl格式文件。网上有Smoodo @ freenode.net ##pentaho做的，infiniDB export.kjb, 完成相关设置即可。

三，infiniDB倒入数据库，运行infiniDB的提供的开源shell脚本，自动导入。

1，windows下编写的shell脚本，放到linux下不能运行，要先dos2unxi转化。判断vim下，:%!xxd 看十六进制是否出现0a0d，对应为"."。

2，注意，kette导出的tbl表，默认是用|作为delimiter。如果你的数据中包含|字符，就会出现错行。先go through 文件内容，确定不包含该delimiter，否则就要更换，配合hive首选"\t"。

3，infiniDB倒库的shell脚本，放在/usr/local/Calpont/data/bulk/data/import路径下。基本内容如下：

cd /usr/local/Calpont/data/bulk/data/import;

/usr/local/Calpont/bin/colxml aso1 -t dimAppNameNew -d "\t" -j 1

/usr/local/Calpont/bin/cpimport -j 1

（1）区分大小写，没-l，默认找dimAppNameNew.tbl。-d "\t"是delimiter改成tab。

（2）一个shell脚本重复执行，会重复插入。只能执行一次。

（3）双引号无影响：/usr/local/Calpont/bin/colxml aso1 -t "dimAppNameNew" -l "dimappnamenew.tbl" -d "\t" -j 1 ，也能正确执行。

（4）shell脚本在不同路径下也能执行。前面的cd是为了让当前路径固定在指定路径下，修改后无影响，所以目前作用不清楚。（好像colxml会默认去找import路径下的文件，没时间去认证了。估计该也是该colxml文件里的配置参数）

（5）shell脚本按-j的配置生成job文件，在/usr/local/Calpont/data/bulk/job下。-j是设置对应的job数，cpimport会完成指定的job，导入。

（6）colxml或者cpimport 加-h可以查看参数信息：

/usr/local/Calpont/bin/colxml -h
显示如下
Usage: colxml [options] dbName

Options:
-d delimiter (default '|')
-e max error rows (numeric)
-h Print this message
-j Job id (numeric)
-l load file name
-n "name in quotes"
-p path for XML job description file that is generated
-s "description in quotes"
-t table name
-u user
-r Number of read buffers (numeric)
-c Read buffer size (numeric)
-w Write buffer size (numeric)
-x Extension of file name (default ".tbl")
-E EnclosedByChar (if data has enclosed values)
-C EscapeChar
-b debug level (1-3)

dbName - Required parm specifying the name of the database;
all others are optional

Example:
colxml -t lineitem -j 123 tpch

如具体的例子：

/usr/local/Calpont/bin/colxml ssp_bi_cloud_saiku -x tbl -d "\t" -l "dimAd.tbl" -j 1

/usr/local/Calpont/bin/colxml ssp_bi_cloud_saiku -t dimad -x tbl -d "\t" -l "dimAd.tbl" -j 1

/usr/local/Calpont/bin/colxml ssp_bi_cloud_saiku -d "\t" dimad -j 1

最后，saiku连接：xml文件已建好，在linux下，放到saiku的安装目录下，看是否连接成功，能否使用。

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

MySQL的角色：Web应用程序中的数据库Apr 17, 2025 am 12:23 AM

MySQL在Web应用中的主要作用是存储和管理数据。1.MySQL高效处理用户信息、产品目录和交易记录等数据。2.通过SQL查询，开发者能从数据库提取信息生成动态内容。3.MySQL基于客户端-服务器模型工作，确保查询速度可接受。

mysql：构建您的第一个数据库Apr 17, 2025 am 12:22 AM

构建MySQL数据库的步骤包括：1.创建数据库和表，2.插入数据，3.进行查询。首先，使用CREATEDATABASE和CREATETABLE语句创建数据库和表，然后用INSERTINTO语句插入数据，最后用SELECT语句查询数据。

MySQL：一种对数据存储的初学者友好方法Apr 17, 2025 am 12:21 AM

MySQL适合初学者，因为它易用且功能强大。1.MySQL是关系型数据库，使用SQL进行CRUD操作。2.安装简单，需配置root用户密码。3.使用INSERT、UPDATE、DELETE、SELECT进行数据操作。4.复杂查询可使用ORDERBY、WHERE和JOIN。5.调试需检查语法，使用EXPLAIN分析查询。6.优化建议包括使用索引、选择合适数据类型和良好编程习惯。

MySQL初学者友好吗？评估学习曲线Apr 17, 2025 am 12:19 AM

MySQL适合初学者，因为：1)易于安装和配置，2)有丰富的学习资源，3)SQL语法直观，4)工具支持强大。尽管如此，初学者需克服数据库设计、查询优化、安全管理和数据备份等挑战。

SQL是一种编程语言吗？澄清术语Apr 17, 2025 am 12:17 AM

是的，sqlisaprogramminglanguges pecialized fordatamanage.1）它具有焦点，focusingonwhattoachieveratherthanhow.2）sqlisessential forquerying forquerying，插入，更新，更新，和detletingdatainrelationalDatabases.3）