怎样搭建平台
亲身参与,作为主力完成了一个信息大数据分析平台。中间经历了很多问题,算是有些经验,因而作答。
整体而言,大数据平台从平台部署和数据分析过程可分为如下几步:
1、linux系统安装
一般使用开源版的Redhat系统--CentOS作为底层平台。为了提供稳定的硬件基础,在给硬盘做RAID和挂载数据存储节点的时,需要按情况配置。例如,可以选择给HDFS的namenode做RAID2以提高其稳定性,将数据存储与操作系统分别放置在不同硬盘上,以确保操作系统的正常运行。
2、分布式计算平台/组件安装
目前国内外的分布式系统的大多使用的是Hadoop系列开源系统。Hadoop的核心是HDFS,一个分布式的文件系统。在其基础上常用的组件有Yarn、Zookeeper、Hive、Hbase、Sqoop、Impala、ElasticSearch、Spark等。
先说下使用开源组件的优点:1)使用者众多,很多bug可以在网上找的答案(这往往是开发中最耗时的地方)。2)开源组件一般免费,学习和维护相对方便。3)开源组件一般会持续更新,提供必要的更新服务『当然还需要手动做更新操作』。4)因为代码开源,若出bug可自由对源码作修改维护。
再简略讲讲各组件的功能。分布式集群的资源管理器一般用Yarn,『全名是Yet Another Resource Negotiator』。常用的分布式数据数据『仓』库有Hive、Hbase。Hive可以用SQL查询『但效率略低』,Hbase可以快速『近实时』读取行。外部数据库导入导出需要用到Sqoop。Sqoop将数据从Oracle、MySQL等传统数据库导入Hive或Hbase。Zookeeper是提供数据同步服务,Yarn和Hbase需要它的支持。Impala是对hive的一个补充,可以实现高效的SQL查询。ElasticSearch是一个分布式的搜索引擎。针对分析,目前最火的是Spark『此处忽略其他,如基础的MapReduce 和 Flink』。Spark在core上面有ML lib,Spark Streaming、Spark QL和GraphX等库,可以满足几乎所有常见数据分析需求。
值得一提的是,上面提到的组件,如何将其有机结合起来,完成某个任务,不是一个简单的工作,可能会非常耗时。
3、数据导入
前面提到,数据导入的工具是Sqoop。用它可以将数据从文件或者传统数据库导入到分布式平台『一般主要导入到Hive,也可将数据导入到Hbase』。
4、数据分析
数据分析一般包括两个阶段:数据预处理和数据建模分析。
数据预处理是为后面的建模分析做准备,主要工作时从海量数据中提取可用特征,建立大宽表。这个过程可能会用到Hive SQL,Spark QL和Impala。
数据建模分析是针对预处理提取的特征/数据建模,得到想要的结果。如前面所提到的,这一块最好用的是Spark。常用的机器学习算法,如朴素贝叶斯、逻辑回归、决策树、神经网络、TFIDF、协同过滤等,都已经在ML lib里面,调用比较方便。
5、结果可视化及输出API
可视化一般式对结果或部分原始数据做展示。一般有两种情况,行数据展示,和列查找展示。在这里,要基于大数据平台做展示,会需要用到ElasticSearch和Hbase。Hbase提供快速『ms级别』的行查找。 ElasticSearch可以实现列索引,提供快速列查找。
平台搭建主要问题:
1、稳定性 Stability
理论上来说,稳定性是分布式系统最大的优势,因为它可以通过多台机器做数据及程序运行备份以确保系统稳定。但也由于大数据平台部署于多台机器上,配置不合适,也可能成为最大的问题。 曾经遇到的一个问题是Hbase经常挂掉,主要原因是采购的硬盘质量较差。硬盘损坏有时会到导致Hbase同步出现问题,因而导致Hbase服务停止。由于硬盘质量较差,隔三差五会出现服务停止现象,耗费大量时间。结论:大数据平台相对于超算确实廉价,但是配置还是必须高于家用电脑的。
2、可扩展性 Scalability
如何快速扩展已有大数据平台,在其基础上扩充新的机器是云计算等领域应用的关键问题。在实际2B的应用中,有时需要增减机器来满足新的需求。如何在保留原有功能的情况下,快速扩充平台是实际应用中的常见问题。
上述是自己项目实践的总结。整个平台搭建过程耗时耗力,非一两个人可以完成。一个小团队要真正做到这些也需要耗费很长时间。
目前国内和国际上已有多家公司提供大数据平台搭建服务,国外有名的公司有Cloudera,Hortonworks,MapR等,国内也有华为、明略数据、星环等。另外有些公司如明略数据等还提供一体化的解决方案,寻求这些公司合作对 于入门级的大数据企业或没有大数据分析能力的企业来说是最好的解决途径。
对于一些本身体量较小或者目前数据量积累较少的公司,个人认为没有必要搭建这一套系统,暂时先租用AWS和阿里云就够了。对于数据量大,但数据分析需求较简单的公司,可以直接买Tableau,Splunk,HP Vertica,或者IBM DB2等软件或服务即可。
以上是我从事大数据以来的一些认识。管见所及,可能有所疏漏,欢迎补充。
如何建立网站平台?
准备工作:
一:域名注册
一般域名尽量要短一些,然后含义通俗易懂,尽量不要把0o和il1放在一起,国内建议使用阿里云,国外域名可以使用Godaddy,Name等
二:虚拟主机
购买主机的时候要注意自己的域名是不是已经ICP备案,如果没有备案不能选择大陆的主机,建议用香港的,毕竟与日韩美比地理位置相对于大陆较近比。这里演示用的主机公园的香港虚拟主机,如果你的域名备案了可以选择大陆的主机,比如阿里云,腾讯云都可以
三:博客系统
本文用使用比较广泛的WordPress做演示,当然如果使用typecho,emlog,discuz 等请参考这个教程如何安装WordPres?(GIF动态教程)
WordPress地址:China 简体中文 (请注意大陆访问会很慢甚至无法加载)
博客搭建:
一:域名解析
Godaddy域名解析请看如何解析域名?(GIF动态教程)
这里已经购买了 主机公园 的香港虚拟主机,购买完成后会把IP发到我邮箱,我们把域名解析到这个IP即可
amp;lt;img src="https://pic2.zhimg.com/50/aa50c9b471e00bdf74f67d0140c3a67a_hd.jpg" data-rawwidth="1278" data-rawheight="355" class="a0de-4eb6-4af2-87f0 origin_image zh-lightbox-thumb" width="1278" data-original="https://pic2.zhimg.com/aa50c9b471e00bdf74f67d0140c3a67a_r.jpg"amp;gt;
amp;lt;img src="https://pic4.zhimg.com/50/060c992033767022e12672ee0f9d14af_hd.jpg" data-rawwidth="1050" data-rawheight="444" class="4eb6-4af2-87f0-6d02 origin_image zh-lightbox-thumb" width="1050" data-original="https://pic4.zhimg.com/060c992033767022e12672ee0f9d14af_r.jpg"amp;gt;
二:安装WordPress
进入用户中心,产品详情,登入cPanel
amp;lt;img src="https://pic2.zhimg.com/50/1c0de63c17db8bf66eb36e97d7ef2e75_hd.jpg" data-rawwidth="1277" data-rawheight="668" class="4af2-87f0-6d02-63f8 origin_image zh-lightbox-thumb" width="1277" data-original="https://pic2.zhimg.com/1c0de63c17db8bf66eb36e97d7ef2e75_r.jpg"amp;gt;
找到图中所示的SoftaCulou
amp;lt;img src="https://pic4.zhimg.com/50/4efb8d49f91df4ed265e77f39c23b2a2_hd.jpg" data-rawwidth="1279" data-rawheight="739" class="87f0-6d02-63f8-3d4c origin_image zh-lightbox-thumb" width="1279" data-original="https://pic4.zhimg.com/4efb8d49f91df4ed265e77f39c23b2a2_r.jpg"amp;gt;
找到WordPress 并安装
amp;lt;img src="https://pic1.zhimg.com/50/beb4503ad4472c1efe9e511618e71035_hd.jpg" data-rawwidth="1279" data-rawheight="736" class="6d02-63f8-3d4c-c438 origin_image zh-lightbox-thumb" width="1279" data-original="https://pic1.zhimg.com/beb4503ad4472c1efe9e511618e71035_r.jpg"amp;gt;
直接添加基本的管理员信息,不用手动上传文件,创建数据库
amp;lt;img src="https://pic4.zhimg.com/50/083fc677cf119b16cc0de808bd7aedcb_hd.jpg" data-rawwidth="1279" data-rawheight="738" class="63f8-3d4c-c438-1e75 origin_image zh-lightbox-thumb" width="1279" data-original="https://pic4.zhimg.com/083fc677cf119b16cc0de808bd7aedcb_r.jpg"amp;gt;
amp;lt;img src="https://pic1.zhimg.com/50/34e918aff295ca8f4246af6d5ae33f4b_hd.jpg" data-rawwidth="1275" data-rawheight="710" class="3d4c-c438-1e75-4cc7 origin_image zh-lightbox-thumb" width="1275" data-original="https://pic1.zhimg.com/34e918aff295ca8f4246af6d5ae33f4b_r.jpg"amp;gt;
amp;lt;img src="https://pic4.zhimg.com/50/1c3af64530297876cda015f2cdb7b876_hd.jpg" data-rawwidth="1279" data-rawheight="696" class="c438-1e75-4cc7-dbf5 origin_image zh-lightbox-thumb" width="1279" data-original="https://pic4.zhimg.com/1c3af64530297876cda015f2cdb7b876_r.jpg"amp;gt;
安装很快,基本上1分钟不要,如果你在这步出错,有可能是因为自己手动创建了数据库或者上传了WordPress文件,删除即可
amp;lt;img src="https://pic1.zhimg.com/50/312163e575ad6a4d2975d1f50bcb8bd3_hd.jpg" data-rawwidth="1275" data-rawheight="478" class="1e75-4cc7-dbf5-2327 origin_image zh-lightbox-thumb" width="1275" data-original="https://pic1.zhimg.com/312163e575ad6a4d2975d1f50bcb8bd3_r.jpg"amp;gt;
安装完成
amp;lt;img src="https://pic3.zhimg.com/50/a2ebaaac851149cfb3fb393824429a3a_hd.jpg" data-rawwidth="1279" data-rawheight="579" class="4cc7-dbf5-2327-99b4 origin_image zh-lightbox-thumb" width="1279" data-original="https://pic3.zhimg.com/a2ebaaac851149cfb3fb393824429a3a_r.jpg"amp;gt;
访问测试,如果熟悉的话,也就是数分钟博客就上线了
amp;lt;img src="https://pic4.zhimg.com/50/2cf80add86e167f12057449e36f8c76d_hd.jpg" data-rawwidth="1278" data-rawheight="734" class="dbf5-2327-99b4-b017 origin_image zh-lightbox-thumb" width="1278" data-original="https://pic4.zhimg.com/2cf80add86e167f12057449e36f8c76d_r.jpg"amp;gt;
怎么建立自己的网站平台?
1.搭建
首先,你需要选择一个建站工具。这里以上线了为例,教大家搭建自己的网站。
打开「上线了」官网,注册好账户后选择“创建网站”,会跳出一个模板界面。
确定好自己要做的主题和方向,然后选择相对应的模板,个人、工作室、公司企业、商店等等很多类型。如果选错了也没关系,在后台编辑时你也可随时更换模块,添加你需要的内容。如相册板块、文本、留言表单、产品展示、简易博客……一些你不需要的旧的板块可以随时删除。在板块编辑器中输入你想要写的内容文本、替换图片和视频,板块布局模式也可以随意更改。
在左侧栏里可以给各版块命名,也可以隐藏这些版块,或者让它不在导航栏中显示。
在【风格】里可以随时更改模板样式、字体、网站主色调。
整个过程就像堆积木一样,只不过建站是堆积自己需要的版块,而且可以随时预览,是不是很方便呢?网站如何制作其实也没你想象的那么难。
2.发布
点击左上角的【设置】,在这里,你可以设置相关信息。包括网站的标题、域名、网站logo、开启多页面网站(当然多页面网站是付费功能)。
3.关于域名
有些小白可能不知道什么是域名,其实域名就是一个网站的网址,你可以使用上线了二级域名,也可以申请一个自定义域名。域名在【设置】里可以直接申请,注意,域名一定要尽量简洁、好记,最好是名称缩写。
我们常见的域名是.com或.cn,我也比较建议注册这种,一些特别奇怪的域名还是不要考虑。
为了保障域名注册审核通过率,注册信息一定要确保正确无误,可别乱填。填好后提交等待审核就好了(一般1~2天),备案后再绑定到相应的网站上即可。
全部设置好后,就可以发布了。点击左上角的“上线”,审核通过后就能看到自己的网站了。
网站发布后,要测试看看有没有bug,浏览是否顺畅,同时也别忘了要经常维护更新哦。这样才能让访客有一个比较好的浏览体验,让网站也能更受欢迎。
以上就是如何制作自己的网站的方法了。如果感兴趣,不如自己探索一下,你会发现制作自己的网站并不难。而互联网时代,不管是企业用来展示自己,还是个人用来找工作,能有一个属于自己的网站,都是件很方便的事。
如何创建自己的信息平台
首先要在计算机上安装并运行肯为旎免费办公平台。
请先下载此平台软件(请用百度自行搜索此平台的下载地址),然后使用winzip或者winrar等工具将下载的文件解压缩,您将会得到一个文件 夹“肯为旎免费办公平台”,打开它,复制其中的xampplite文件夹到某个盘的根目录下,比如复制到D盘的根目录下,复制完成后得到的目录类似 于:D:\ xampplite,安装完成。
然后启动此平台。打开D盘的根目录下xampplite文件夹,在打开的文件夹中双击kenweini_start.bat文件,就会自动运行本程序,同时自动打开浏览器到本系统的首页。
温馨提示:更详细的安装使用方法请参阅下载的压缩包中的使用手册。
手机安装旎信应用。
此步的目的是让您的手机能够接收到别人发送的信息,当然发送和接收是没有任何费用的,不然谁会使用它,呵呵。
请先下载旎信应用软件(请用百度自行搜索下载地址),然后在手机中安装它,至于如何安装它,我就不啰嗦了,大家都会的。
连接WIFI。
我想建立一个网上平台怎么建
需要做的准备: 1、一个网站程序代码:如果你只是想建立一个比较简单的展示网站,可以通过一些开源的后台来做,比如织梦和帝国的后台。 2、买一个域名和空间 3、将代码上传到空间里面,做好解析就可以了。 最后:建网站虽然不是很难,但是也不是
1、如何建立短信平台?
这个问题有三个理解
1、你想发短信在找短信平台,想开通帐号发短信,这个就简单了,随便百度一下就能找一大把,想找靠谱的也不少,什么皓宇信息通、238都不错
2、你有自己的平台或是网站,想开通短信功能,这种情况需要做接口,跟短信公司做对接,以上提到的公司也基本都有此类服务。
3、你想开发一个短信平台,然后让别人用你的平台发短信。这种情况需要技术力量,开发好之后还得找通道商以协议的形式接入通道