Yahoo Japan 数据基础设施研讨会
→ データを取得およびパッケージ化する部門、および提供する場所
→ ユーザーフレンドリーにする部門、およびレコメンデーションなどを提供する場所
→ データインフラストラクチャ
6.5百亿页面浏览量
雅虎的广告系统和Hadoop上的SQL。
通过技术加速不断发展的广告业务和行业。
YDN广告…推荐在Yahoo首页上的那个。
最近发展迅速
-
- 広告レポートの使命
-
- これまでの取り組み
- 挑戦と貢献
广告报告的使命是什么?
需要的东西 de
吞吐量和可扩展性
每天发生60亿行。
随着服务的增加和集计项目的添加,数据量迅速增加。
需要具备灵活的可扩展性来应对这种情况。
追求的目标
-
- 機能
-
- 体感
- 使い勝手
雅虎在运营和研究方面与谷歌相比成本相差了3到4倍。
过去的努力
传统系统
每天发生10亿行数据,
在RDB中处理它很困难。
当时的对策
按账户组进行文件输出
水平分割
虽然吞吐量有所增加,但是…
功能受限发生
文件分割速度变慢→无法及时提供第二天的数据
将SQL引入Hadoop系统
瞪羚
最初尝试Impala
不過,增加集群可以對功能限制和服務水平的降低起到貢獻,但卻存在可擴展性問題。
2015年7月开始提供服务。
Hive在Tez上运行
虽然延迟并不是很严重,但还是不错的,采取了解决传统的MapReduce问题的方法。
可以实现可扩展性保证
预计于2016年开始提供服务。
挑战与贡献
目标是实现亚秒级查询。
人们期待低延迟化的每一天。
Hive on Tez + LLAP 与 Phoenix 的比较
由于问题的存在,我们一直在日益改进。同时我们也在关注两个方面。
以前我们使用了Yahoo.inc的封闭源代码,但现在我们与HortonWorks合作,开始努力工作。
我们开始提供开源软件的补丁,并为行业做出贡献。
我们希望展现我们的实力。
大规模的HDFS和纠删码技术
分散计算黑带.
-
- Yahoo JapanのHadoopが取り巻く環境
- 大規模HDFSが直面する課題
数据使用量和CPU使用量指数级增加
集群数量增加到6000台
普通的HDFS… de HDFS…)
有3000个DataNode,共有1.3亿个文件和1.6亿个块,导致块报告变慢…
在NameNode上发生垃圾回收导致变慢
有效数据量为60PB,实际可用的是20PB,从成本角度来看非常惊人。
区块报告延迟问题
如果NameNode的启动很慢(几个小时),那么无法提供服务。
为什么区块报告这么慢?
因为要进行差异比较和其他各种操作,所以所以的过程变慢了。
我明白原因了。
暫定対策
運用手順で対応 10分くらいで終わる
全DataNode Stop
NameNode起動・再起動
根本対策
コミュニティと連携して根本敵にソースコードを修正する
Hadoop2.6.1から入る
存储成本问题
为了保持耐障害性,需要三个副本。
耐久度为2,额外开销为200%。
通过ErasureCoding进行改善
通过ReedSolomon(6,3)进行改善
精细地进行条纹处理
6个区块的条纹,3个奇偶性
Durability=3, Overhead=50% → 耐久性=3、开销=50%
最大的优点是需要较少的磁盘容量。
缺点是会产生较多的网络流量和CPU使用率。
ErasureCoding的写入性能很好,因为同时运行了9个从节点,所以很快。
-
- CPU,Networkのデメリットは許容できる
- ストレージコストのメリットが大きい
存储政策
根据数据访问频率来决定
-
- HOT 毎日・毎週
-
- WARM 毎月
- COLD ほとんど使わない
关于Yahoo的下一代管道
数据管道是什么?
高效地将分散的数据收集到分析基础设施中
管道建立了数据解决方案的良性循环。
数据高速公路
雅虎公司制造
封闭系统的局限性
-
- 試行回数が少ない
-
- システムそのものの開発スピードが遅い
成長速度について行けない
I/Fがオープンではないため、ガラパゴス化する
汎用的よりも特化的
導入コストがかかる
プロダクトごとに管理が必要になって困る
随着数据量的急剧增加,销售额没有增长,而是通过技术实力加以弥补。
不仅要增加服务器,还要增加每一层来进行适应。
使用开放技术
下一代管道
-
- Kafka
-
- MirrorMaker
-
- OCP
-
- sw
- Fabric Network
卡夫卡指的是
消息经纪人。
其他公司也有处理大规模数据的成功案例。
镜像制造机
将Kafka集群数据进行镜像备份的工具。
总结
为全球数据管道的发展做出贡献。
卡夫卡与日本见面计划!1月16日
LT(Long Term)
Yahoo的关系数据库(RDB)和最新的MySQL验证结果。
小黑在DB管理方面和三谷先生一样出色。
Yahoo使用什么样的关系数据库(RDB)?
-
- Oracle 11g RAC Enterprise Edition
200DB
広告、ヤフオク、ショッピング、トラベル、ニュースetc…
MySQL 5.1 Percone 5.5
MySQL的新版本。
5.7版本发布了。
查询重写插件
在Oracle和PostgreSQL中不可用的缓冲池。
Ambari和大型集群以及我
完全开源的100%管理Hadoop的搭建、管理和运维
我們正在使用四個Ambari集群來完成本次工作。
1000个部署问题
同時に1000台追加することはできません。
少しずつ増やそうとすると、通信ができません。
原因
資料庫的死結
連線數目達到限制
对应
每次增加100台(不可能)
Arp队列设置
網頁使用者界面出現嚴重問題
2.1.0 升级后变得非常卡顿
一些功能变得很慢
应用补丁
关于InfluxDB
时间序列数据库
通过连续观测某一现象的时间变化而得到的数值序列
可以在股票等方面使用
时间结构化合并树
减少磁盘容量
很快就会遇到错误
如果使用rpm进行安装后遇到了错误。
雅虎日本ID的背后
在使用服务时需要的Yahoo Japan ID
适用于Yahoo Japan专用的标识符
-
- ヤフーIDの属性管理DB
- 独自KVS
存储数据
超过2亿
超过800种类
每个账户6kb
连接客户端数量超过10000台
请求数量为110k RPS
服务器的数量是多少?
有16台。
为了实现4重化,需要80台。
情报资产的访问控制列表
分散系统面临的挑战
处理模型的推移太过混乱。
为什么这里有这么多?
现有模型过于简化了。
现实是复杂的…
-
- リアルタイム処理にそもそも向かなかった
-
- 処理最適化してもうまくいかなかった
- 分散クラウドデータベースの分野でも単純化の反動
问题很多,让人感到困惑。
是似曾相识的感觉…?
在超级计算(并行)的领域中,我们要做的是作业管理。
而在并行数据库的领域中,我们要做的是查询并行化。
只要我们从历史中学习,就应该知道!