Kylin:是一个开源的、分布式的分析型数据仓库系统,提供 Hadoop/Spark 之上的 SQL 查询接口及多维分析(OLAP)能力以支持超大规模数据,它能在亚秒内查询巨大的表,进行逐级聚合。
多维分析:有套路的数据分析, 无套路的数据分析,可以使用impala。
一、kelin安装
1、配置环境变量
vi /etc/profile
export JAVA_HOME=/opt/apps/jdk1.8.0_191/ export HADOOP_HOME=/opt/apps/hadoop-3.1.1 export HIVE_HOME=/opt/apps/apache-hive-3.1.2-bin export Hbase_HOME=/opt/apps/hbase-2.0.6 export KYLIN_HOME=/opt/apps/kylin-3.1.0/ export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$Hbase_HOME/bin:$HIVE_HOME/bin
2、去掉zookeeper端口号
修改 hbase-site.xml
hbase.zookeeper.quorum doitedu01,doitedu02,doitedu03
3、检查运行环境
${KYLIN_HOME}/bin/check-env.sh
4、启动kylin
[root@doitedu03 kylin-3.1.0]# bin/kylin.sh start
二、概念解读
度量:指标是针对什么字段运算得出的, sum(度量)
指标:要计算的人数、会话数、访问量、访问时长
纬度:从设备类型的角度来看上面的指标,group by (纬度)
更多大数据学习、面试资料,请扫码关注我的公众号:
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)