maven相关

博客分类：

java

1、dependency scope: compile test provided runtime exclusion:排除传递依赖 2、localRepository repository id server distributionManagement mirror 3、生命周期和plugin 三套生命周期 clean default site pre-clean 1）pre-clean：执行清理前需要完成的工作 2）clean：清理上一次构建生成的文件 3）post-clean：执行清理后需要完成的工作 default: ...

2019-05-06 10:50
浏览 372
评论(0)
分类:互联网

mybatis-plus-3.0 通用crud实现原理

博客分类：

java

mybatis-plus-3.0 通用crud实现原理 mapper创建流程（@MapperScan 具体实现细节） 1》factory创建之后回调各个BeanFactoryPostProcessor 2》ConfigurationClassPostProcessor#processConfigBeanDefinitions 处理@Configuration注解 3》依次处理 application（@SpringBootConfi ...

2019-04-10 18:28
浏览 864
评论(0)
分类:互联网

美图端到端（客户端到服务端）一体化监控

美图端到端（客户端到服务端）一体化监控一、架构演进 zabbix open-falcon 立体化二、相关技术 ELK prometheus influxdb opentsdb grafana（统一展示） metricfilebeat https://blog.csdn.net/u014773389/article/details/81207017 分布式trace 三、AI ops ruptures https://pypi.org/project/ruptures/ metis https://github.com/Tencent/Metis <企业级 ...

2018-12-01 22:26
浏览 440
评论(0)
分类:互联网

区块链场景化应用

区块链场景化应用一、抽象分类：数字资产、共享账本（平等、共享、自治、共建）二、场景： 1、供应链金融（2B）：痛点：小企业发展快，但是融资难。银行无法监控小企业还款，想响应国家号召落地有难处。例子：比亚迪--轮胎厂--轮毂厂--铝锭--铝矿。问题：中国特色，押款。解决方案：核心企业（银行相信一级供应商）授信成为数字资产上链，之后当债券流通。解决的问题：三角债以债多还降低小企业融资成本必要性：是不是非要上链不可；链下是否真实；合规合法；参与动力适合情况：多方参与，互不信任；可信机构保证真实；提升效率，降低成本 2、游戏（2C） ...

2018-12-01 22:25
浏览 356
评论(0)
分类:互联网

B端产品学习笔记

博客分类：

总结整理

B端产品学习笔记一、B端产品分类:协作办公即时通讯企业管理销售运营。二、功能的本质:数据的增删改查 ,从数据流转的角度看整个系统三、C端与B端产品的区别: 1、流转的数据归谁所有，归谁支配 2、谁来付钱四、产出竞品分析产品分析用户调研报告发展路线图需求说明文档需求排期文档站点地图传统企业数字化一、行业现状审批复杂效率低；经营边际成本递增；国际上传统企业（walmart）曾经自己发射过卫星，非常重视it技术；对自己的客户完全不了解，复购率？消费者年龄段？；产品战略倒挂，经理谈战略，总监谈战术，CEO谈按钮；总结：管理上成本高 ...

2018-12-01 22:25
浏览 766
评论(0)
分类:互联网

常用大数据组件

1、实时 flume(收集日志)--> kafka(缓存队列，平衡采集和消费端)--》storm（实时计算）--》hdfs 2、离线 spark + hdfs 核心组件：storm spark

2018-09-08 22:09
浏览 2078
评论(0)
分类:互联网

消息队列mq的3个使用场景

博客分类：

架构设计
java

一、抵御流量洪峰，整体架构设计如下： 1、nginx+tomcat 2、tomcat controller取到请求后向rocketmq 发送一个msg，将msg id返回给app，同时在redis里缓存msg状态为init（设置定时时间，时间到后清除） 3、client（app/h5/小程序）通过msg i ...

2018-09-01 19:11
浏览 2938
评论(0)
分类:互联网

大数据、数据仓库和ETL

博客分类：

总结整理

一、背景大量原来线下的业务电子化之后，产生了很多的数据，这些数据除了能够支撑业务正常运转，也能够使分析人员针对整个企业的运转情况进行分析。比如，本周与上周相比销量增加还是减少了？原因是什么？产品的库存周期长了还是短了？哪些产品需要及时补充库存？哪些供应商提供的商品，成本低、质量好、及时供货、客户比较喜欢？哪些地方的支出变多了？用户对我的产品满意吗？客户发生了哪些变化？需要招人吗？招什么样的人？上面这些问题分别涉及销售、库存、采购、会计、客户、HR等各个层面。二、业务型系统与分析型系统的区别 OLTP VS OLAP OLTP：代表具体的操作，是对原 ...

2018-07-27 20:50
浏览 4337
评论(0)
分类:互联网

单机与分布式的组件差异

博客分类：

总结整理

一、单机程序 1、用内存进程队列实现解耦合和异步（观察者模式）， 2、用数据库来管理数据， 3、用锁和条件来同步线程， 4、用内存存储数据， 5、用多线程提高并发， 6、防止被kil掉（多个进程之间彼此守护，在合适的时候互相拉起）二、分布式环境下： 1、消息队列 mq实现异步化（顶住流量洪峰）和解耦（适合彼此调用关系非常复杂的场景）， 2、数据库hash实现分库分表，ES实现快速查询 3、分布式锁来同步各个服务（进程）或资源（比如db）， 4、使用redis等替代内存， ...

2018-07-25 15:51
浏览 666
评论(0)
分类:互联网

Webmagic 内部实现

博客分类：

java

Webmagic 内部实现 1、Site的地位是全局的setting或环境 2、scheduler 大概是一个url排序和去重的队列 3、downloader 封装httpclient连接池，进行下载操作；结果产出page（封装下载的内容和http 状态码） 4、PageProcessor 对下载的内容做处理 pipeline：对processor处理的结果进行计算、持久化等处理 5、spider 组织所有的流程和模块。核心逻辑 run：1》创建线程池，2》从scheduler获取URL 3》调用downloader下载 4》回调PageProcessor 4》提取新的ur ...

2018-07-23 11:51
浏览 823
评论(0)
分类:互联网

大数据数据仓库《大数据之路：阿里巴巴大数据实践》读书笔记

博客分类：

总结整理

一、基本概念 1、数据仓库：是一个面向主题的（Subject Oriented）、集成的（Integrated）、相对稳定的（Non-Volatile）、反映历史变化（Time Variant）的数据集合，用于支持管理决策(Decision Making Support)。其中最核心的是集成 ...

2018-07-17 18:11
浏览 821
评论(0)
分类:互联网

dubbo 概览

1、stub：存根，桩，模拟的代理远端的服务，可以附加容错等功能。 2、消费方 stub：内部使用proxy，提供容错等机制，配置时使用stub <dubbo:reference id="userService" interface="org.huxin.dubbo.test.user.service.UserInterface" stub="org.huxin.dubbo.test.UserServiceStub" protocol="dubb ...

2018-07-09 21:34
浏览 306
评论(0)
分类:互联网

ElasticSearch 三建立索引快的原因

博客分类：

总结整理

https://blog.csdn.net/u010994304/article/details/50427672 一、lucene 本身的机制：index分多个segment存入磁盘，新的文件存入新的segment，搜索器更新到新的segment 二、es的改进 1、新的segment不是fsync到磁盘，而是同步到内核文件缓存（默认1s），内核文件缓存再在合适的时间真正刷磁盘 2、fsync之前怎么保证可靠？使用translog记录这段时间的操作，translog本身每5秒刷一次磁盘 3、合并小的旧的segment 代码： S ...

2018-07-09 18:02
浏览 791
评论(0)
分类:互联网

ElasticSearch 二查询快的原因

博客分类：

总结整理

https://www.jianshu.com/p/ed7e1ebb2fb7 1、内部使用Lucene的倒排索引，为每个field建立一个docid列表（Posting list） 2、不同的field名字建立一个term dictionary（每个term对应原来的一个field），并且term本身进行索引（trie 树） 3、数据进行压缩 4、组合查询时的优化注意点： ID尽量有规律、去掉不必要的索引、去掉不必要的analyzed

2018-07-09 17:25
浏览 2402
评论(0)
分类:互联网

ElasticSearch 一基本概念

博客分类：

总结整理
java

1、Indices 索引，类似于mysql的Databases 2、Types 类型，类似于mysql的Tables 3、Documents 文档。类似于mysql的Row 4、Fields 域，字段，类似于Column 5、schema mapping：所有文档写进索引之前都会先进行分析，如何将输入的文本分割为词条、哪些词条又会被过滤，这种行为叫做映射（mapping）。一般由用户自己定义规则。定义后续数据如何建立索引，会定义数据的类型、是否索引、是否存储等，已有数据要改变映射关系需要reindex，mapping在整个index内有效（type不能作为作用域）。索引类型：analy ...

2018-07-09 17:22
浏览 468
评论(0)
分类:互联网

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

maven相关

mybatis-plus-3.0 通用crud实现原理

美图端到端（客户端到服务端）一体化监控

区块链场景化应用

B端产品学习笔记

常用大数据组件

消息队列mq的3个使用场景

大数据、数据仓库和ETL

单机与分布式的组件差异

Webmagic 内部实现

大数据数据仓库《大数据之路：阿里巴巴大数据实践》读书笔记

dubbo 概览

ElasticSearch 三建立索引快的原因

ElasticSearch 二查询快的原因

ElasticSearch 一基本概念

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最近访客更多访客>>