-
搭建大数据处理集群(Hadoop,Spark,Hbase)
所属栏目:[大数据] 日期:2021-02-28 热度:94
副标题#e# 搭建Hadoop集群 配置每台机器的 /etc/hosts保证每台机器之间可以互访。 120.94.158.190 master 120.94.158.191 secondMaster 1、创建hadoop用户 先创建hadoop组 sudo addgroup hadoop 然后再建一个hadoop用户加入到hadoop组,(前一个为组,后一[详细]
-
【杭电oj】1715 - 大菲波数(大数递推)
所属栏目:[大数据] 日期:2021-02-28 热度:198
点击打开题目 大菲波数 Time Limit: 1000/1000 MS (Java/Others)????Memory Limit: 32768/32768 K (Java/Others) Total Submission(s): 17138????Accepted Submission(s): 5689 Problem Description Fibonacci数列,定义如下: f(1)=f(2)=1 f(n)=f(n-1)+f([详细]
-
数据处理---Spring Batch之基础
所属栏目:[大数据] 日期:2021-02-26 热度:179
? ? ? Spring框架提供了强大的底层结构,基于此,Spring出现了很多方面的应用。Spring Batch就是其一,它是一个轻量级的,完全面向Spring的批处理框架,可以应用于企业级大量的数据处理系统。Spring Batch以POJO和大家熟知的Spring框架为基础,使开发者更[详细]
-
数据处理---Spring Batch之实践
所属栏目:[大数据] 日期:2021-02-26 热度:157
副标题#e# 上面介绍了Spring Batch的基本概念和简单的demo项目,显然这些还是不够实际使用的。下面我们来更多的代码实践。 ? ? ? ? 在上面的基础项目上面,我们来更多的修改: ? ? ? ? 不用项目默认的hsql DB,用mysql,让ItemReader,ItemWriter 支持mysql;[详细]
-
Pentaho BI Server的启动过程详解(二)
所属栏目:[大数据] 日期:2021-02-26 热度:126
时隔好久现在接着上一篇来继续聊一下Pentaho BI Server的启动过程,今天主要讲的就一个类PentahoSystem。 软件版本 Pentaho BIServer 5.0.1-ce 关于PentahoSystem 在上一篇文章里已经介绍过在SolutionContextListener中当应用启动时分调用PentahoSystem的i[详细]
-
【最强干货】关于文本挖掘的资料(文献,报告,策略,代码)
所属栏目:[大数据] 日期:2021-02-26 热度:115
副标题#e# 查看之前文章请点击右上角 ,关注并且 查看历史消息 所有文章全部分类和整理 ,让您更方便查找阅读。请在页面菜单里查找。 今天没有策略研究推送。 有几篇文章还需再研究一下 好久没有给大家干货啦 今天给大家一些干货福利 文本挖掘方面的资料 文[详细]
-
暴力:大数加法
所属栏目:[大数据] 日期:2021-02-26 热度:162
Description The I-number of x is defined to be an integer y,which satisfied the the conditions below: 1. yx; 2. the sum of each digit of y(under base 10) is the multiple of 10; 3. among all integers that satisfy the two conditions above,[详细]
-
大数乘法,大数加法,大数减法
所属栏目:[大数据] 日期:2021-02-25 热度:165
#include iostream #includecstring using namespace std; class MData { private: int n,m; char *str1,*str2; public: char *mul();//乘法 char *add();//加法 char *sub();//减法 char *div();//除法 MData(); MData(const char *s1,const char * s2);[详细]
-
大数据预测欧洲杯决赛:C罗成法国夺冠最大变数
所属栏目:[大数据] 日期:2021-02-25 热度:192
本文首发于公众号 足球魔方(ID:zuqiumofang),由 足球魔方 授权 大数据 转载。如需转载请与作者联系,谢绝二次转载。 足球魔方数据研究院 重磅推出 欧洲杯决赛大数据前瞻 7月8日凌晨,欧洲杯半决赛东道主法国队以2-0完胜德国,昂首晋级后将在圣但尼-法[详细]
-
数据处理之标准化/归一化方法
所属栏目:[大数据] 日期:2021-02-25 热度:158
数据处理之标准化/归一化方法 归一化方法(Normalization Method) 1.把数变为(0,1)之间的小数 ? ? ? 主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速,应该归到数字信号处理范畴之内。 2.把有量纲表达式变为无量纲表达式[详细]
-
算法在身边——学习算法从妈妈的菜谱开始
所属栏目:[大数据] 日期:2021-02-25 热度:112
副标题#e# 听到“算法(Algorithm)”这个词,大部分人都觉得好像很艰深晦涩。的确,这不是一个常常能听到的词。事实上,在数学、计算机等理工科领域,所谓的算法,指的就是“对特定问题的解决步骤”。而这里说的特定问题,通常有: ? 对信息进行排序 ? 搜[详细]
-
数据处理---Spring Batch之进阶
所属栏目:[大数据] 日期:2021-02-24 热度:171
有了前面两篇的基础之后,我们一起来聊聊更高级的关于Spring Batch的话题。比如Job 配置;自定义各种Listener;控制步骤流程;自定义Reader,Processor,Writer;并行处理。这些东西在Spring Batch的使用中很多可能会需要的,当然还有更多的内容,最好找下文[详细]
-
什么是BI ? 哪些行业需要用到BI?
所属栏目:[大数据] 日期:2021-02-24 热度:181
什么是BI?哪些行业需要用到BI? BI——就是分析利用企业已有的各种商用数据来了解企业的经营状况和外部环境,从而为企业的经营决策提供数据支撑。 下面我们来详细分解下: 企业应用BI的目标即是期望通过对来自不同的数据源进行统一处理及管理,把数据变成[详细]
-
[每月好书] 写给大家看的算法书(来自漫画帝国的图解算法书:轻
所属栏目:[大数据] 日期:2021-02-24 热度:125
副标题#e# 和老规矩一样,本月月考的奖品就是《写给大家看的算法书》两本。不知道什么是月考的同学,请补习下面文章: 每月送书活动来袭,免费哦! 另外,为了避免每次月考都是相同的同学获得最高奖,从上次月考开始,获得过最高奖(得到过书)的同学,将不能[详细]
-
斯特林大数公式求阶乘位数
所属栏目:[大数据] 日期:2021-02-24 热度:134
? 题目链接: ? ? ? ? ? ? ? FZU: ? ?-?Link?- ? ? ? ? ? ? ? NYOJ ? ? ??? ? ?无意在FZU上看到这道题,以前在NYOJ上做过不过又忘了怎么做了; ? ?网上找找才记起来这个斯特林大数公式;log(n!)=log10(sqrt(2*pi*n))+n*log10(n/e)+1; ? ? ? ? ? ? ? ? ? ?[详细]
-
同义词挖掘
所属栏目:[大数据] 日期:2021-02-24 热度:139
词典百科词条 1:规则提取数据,对于一些别名,或者关键词括弧类的数据,或者简称等. 2.提取简要关键词,计算夹角余弦. 上下文相关性挖掘(需要人工审核) 在所有的文档中,如果两个term经常在相同的上下文下出现,那么这两个词是同义词的可能性较大。基于这个假[详细]
-
电商卷皮BI的实践演进和架构体系—猫友会大讲坛第4期
所属栏目:[大数据] 日期:2021-02-24 热度:85
副标题#e# 大家好,我是卷皮BI团队负责人柴楹,今天在这里给大家分享一下卷皮的BI和大数据的一些东西。 BI大数据是什么? 首先我们来聊一下BI和大数据。BI和大数据到底有什么关系和不同。 BI主要有三方面的技术,包括 DW,OLAP,DM。目标就是提高企业经营和[详细]
-
搞得定基因组分析的TB级数据处理,跑的赢摩尔定律的发展边际,劲
所属栏目:[大数据] 日期:2021-02-24 热度:192
↓↓↓[详细]
-
手把手教你从0到1构建大数据分析平台(仅剩18个名额)
所属栏目:[大数据] 日期:2021-02-24 热度:103
副标题#e# StuQ?联合三位大数据资深专家桑文锋、曹犟、付力力共同推出《从0到1构建大数据分析平台》精品小班教学,仅有 60 席位,精品小班课区别于大众在线视频教学,课程设置具有如下特色: 采用在线视频直播授课 以实战为主 在线解答疑问 课后作业review[详细]
-
【企业推荐】蚁坊软件-专业从事互联网大数据分析
所属栏目:[大数据] 日期:2021-02-24 热度:194
副标题#e# 大 数 据 人 报道DT时代应用资讯及动态,爆料剖析行业热点新闻 本文系蚁坊软件投稿于大数据人发布。欢迎更多优质原创文章投稿给大数据人:289585305@qq.com 湖南蚁坊软件有限公司 一、公司介绍 1、公司简介 湖南蚁坊软件有限公司成立于2010年8月[详细]
-
大数相减-c++
所属栏目:[大数据] 日期:2021-02-24 热度:82
/*题目:输入两行字符串正整数,第一行是被减数,第二行是减数,输出第一行减去第二行的结 /果。 /大数一般会超出长整型的范围,所以用字符串存储数据然后按照减法运算法则实现就成了。 /string类成员函数功能强大! */ #include iostream#includestringus[详细]
-
LightOJ1282 Leading and Trailing 大数取首尾
所属栏目:[大数据] 日期:2021-02-01 热度:184
任何一个数都可以转换为10^k,k是一个小数,k的整数部分决定了这个数的位数,小数部分决定了每一位的值,根据此可以快速找到前三位。 通过快速幂取模可以快速找到后三位。 题目链接:http://acm.hust.edu.cn/vjudge/problem/26992 #pragma comment(linker,[详细]
-
数据处理之——data.table
所属栏目:[大数据] 日期:2021-02-01 热度:66
副标题#e# data.table简介 关于 R 中的数据处理,我们接着介绍 data.table 包。上期我们介绍的 dplyr 有类似于sql的一套数据处理的语法,而 data.table 则有着它自己的一套语法,它能处理几乎所有 dplyr 可以处理的数据,而且代码量更少,效率更高,特别是[详细]
-
日均请求量百亿级数据处理平台的容器云实践
所属栏目:[大数据] 日期:2021-02-01 热度:54
from:?http://geek.csdn.net/news/detail/97887 声明:本文为CSDN原创投稿文章,未经许可,禁止任何形式的转载。? 作者:袁晓沛,目前在七牛云的主要工作是基于容器平台构建分布式应用,借助容器的优势,实现大规模分布式应用的自动化运维以及高可用,以Pa[详细]
-
如何计算文档相似性
所属栏目:[大数据] 日期:2021-02-01 热度:194
最近课题需要,整理一下文档相似性的一些研究,主要是参考知乎上面的回答和52nlp的相关文章。以备后期综述使用。具体还需要好好细读链接。 主要思路 01/one hot representation,BOW+tf-idf+LSI/LDA体系. docsim方法:gensim包,使用corpora.Dictionary(te[详细]

浙公网安备 33038102330484号