第1章 机器学习概述 1.1 机器学习是啥? 机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 即通
转载 2020-05-28 10:09:00
589阅读
2评论
第1章 Sqoop 简介 Sqoop 是一款开源的工具,主要用于在 Hadoop(Hive) 与传统的数据库 (mysql,postgresql,...) 间进行数据的高校传递,可以将一个关系型数据库(例如:MySQL,Oracle,Postgres等)中的数据导入 Hadoop 的 HDFS 中
转载 2020-05-30 19:07:00
518阅读
2评论
第1章 Oozie 的简介 Oozie 英文翻译为:驯象人。一个基于工作流引擎的开源框架,由 Cloudera 公司贡献给 Apache,提供对 Hadoop MapReduce、Pig Jobs 的任务调度与协调。Oozie 需要部署 Java Servlet 容器中运行。主要用于定时调度任务,
转载 2020-05-30 20:17:00
573阅读
2评论
个工作流调度系统来调度
转载 2020-05-20 14:35:00
337阅读
2评论
Git 是一个开源的分布式版本控制系统,用于敏捷高效地处理任何或小或大的项目。 Git 是 Linus Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。Git 与常用的版本控制工具 CVS, Subversion 等不同,它采用了分布式版本库的方式,不必服务器端软件支持。 本文将带你git入门git实战,最后成神
原创 精选 11月前
230阅读
@ 目录 1. 网站服务 2. 所谓Nginx 3. 安装Nginx 4. Nginx配置文件详述 5. 开始玩转Nginx Nginx虚拟主机 Nginx状态信息(status)配置 Nginx错误页面优化 Nginx访问日志(access_log) Nginx限制来源IP Nginx动静分离 ? 1. 网站服务 ????想必我们大多数人都是通过访问网站而开始接触互联网的吧。我们平时访问
转载
zyk
2021-08-05 17:22:24
273阅读
ES、Kibana官网介绍 kibana官网介绍:https://www.elastic.co/cn/kibana/ ELK docker安装:https://hub.docker.com/r/sebp/elk 【sebp/elk包含ES和kibana】 ELK Docker安装 1 # 拉取ELK ...
转载 2021-10-25 19:20:00
133阅读
2评论
一 概述 1.1 为什么需要工作流调度系统 1)一个完整的数据分析系统通常都是由大量任务单元组成: shell 脚本程序,java 程序,mapreduce 程序、hive 脚本等。2)各任务单元之间存在时间先后及前后依赖关系。3)为了很好地组织起这样的复杂执行计划,需要一个工作流调度系统来调度执行
转载 2020-05-30 19:09:00
930阅读
2评论
Spark on Yarn | Spark入门精通
转载 2021-07-23 18:33:50
268阅读
OpenResty 依赖库有: perl 5.6.1+, libreadline, libpcre, libssl。所以我们需要先安装好这些依赖库,也非常简单:download:《极客时间》OpenResty入门实战apt-get?install?libreadline-dev?libpcre3-dev?libssl-dev?perl如果你的系统是 Centos 或 RedHat 可以使用以下
原创 2021-03-24 00:27:04
733阅读
第一章 数据库的概述 1.1 什么是数据库 ? 数据库是按照数据结构来组织、存储和管理数据的仓库。 ? 我们的程序都是在内存中运行的,一旦程序运行结束或者计算机断电,程序运行中的数据都会丢失。 ? 所以我们就需要将一些程序运行的数据持久化硬盘之中,以确保数据的安全性。而数据库就是数据持久化的最佳选
转载 2020-05-31 11:58:00
277阅读
2评论
简介 第一次接触Protobuf实际使用已经有半年多,刚开始可能被它的名字所唬住,其实就它是一种轻便高效的数据格式,平台无关、语言无关、可扩展,可用于通讯协议和数据存储等领域。 优点 平台无关,语言无关,可扩展; 提供了友好的动态库,使用简单; 解析速度快,比对应的XML快约20-100倍; 序
转载 2018-12-13 12:38:00
220阅读
2评论
这篇文章我想和你聊一聊 Redis 的最佳实践。你的项目或许已经使用 Redis 很长时间了,但在使用过程中,你可能还会或多或少...
转载 2021-08-16 09:42:55
190阅读
上篇 |基础篇一、环境服务器版本:CentOS 7....
转载 2021-08-15 15:03:16
192阅读
第10章 Hive实战之谷粒影音 10.1 需求描述 统计硅谷影音视频网站的常规指标,各种TopN指标: 统计视频观看数Top10 统计视频类别热度Top10 统计出视频观看数最高的20个视频的所属视频类别以及对应视频类别的个数 统计视频观看数Top50所关联视频的所属类别Rank 统计每个类别中的
转载 2020-05-30 18:46:00
216阅读
2评论
第6章 查询 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Select查询语句语法: [WITH?CommonTableExpression?(,?CommonTableExpression)*] (Note:?On
转载 2020-05-30 18:42:00
228阅读
2评论
"@ 目录 1. 网站服务 2. 所谓Nginx 3. 安装Nginx 4. Nginx配置文件详述 5. 开始玩转Nginx Nginx虚拟主机 Nginx状态信息(status)配置 Nginx错误页面优化 Nginx访问日志(access_log) Nginx限制来源IP Nginx动静分离 ? 1. 网站服务 ????想必我们大多数人都是通过访问网站而开始接触互联网的吧。我们平时访
转载
zyk
2021-08-05 17:20:35
184阅读
这篇文章我们来讲下 Spring Boot 中如何整合 ES,以及如何在 Spring Cloud 微服务项目中使用 ES 来实现全文检索,来达到搜索题库的功能。 而且题库的数据量是非常大的,题目的答案也是非常长的,通过 ES 正好可以解决 mysql 模糊搜索的低效性。 通过本实战您可以学到如下知识点: Spring Boot 如何整合 ES。 微服务中 ES 的 API 使用。
转载 2021-08-15 21:43:10
414阅读
REmote DIctionary Server(Redis) 是一个开源的,基于 key-value 键值对的持久化的非关系型数据库存储系统。它支持的数据存储类型包括:...
转载 2021-07-20 10:13:04
131阅读
  • 1
  • 2
  • 3
  • 4
  • 5


http://www.vxiaotou.com