在 InfoQ 对我的采访发布后,我看到已经有网站在转载文字稿。其实口头的东西转换到文字,自己的话难免有些辞不达意的地方,征求 InfoQ 泰稳的意见后,我在这里就部分问答作一下修正,以免误导。
以下是正文:
InfoQ中文站: 作为一名资深的 DBA,大辉却在自己的 BLOG 上边写了不少关于网站架构这方面的一些文章,能不能谈谈 DBA 跟网站架构这方面的关系呢?
Fenng: 好多朋友和我开玩笑,说我做一个DBA,却总去写一些架构相关的东西,"是不是这个厨子不看菜谱,看兵法了?" 其实这二者之间我觉得是有些关系的。像数据库的维护,甚至设计、架构相关的工作,做到一定程度上还是要向前再走几步:也就是说要把我们架构相关的一些事情融合进来。当然作为一个 DBA 没必要一定要像我们的相关架构师这样,去做一些编码之类的实际工作,不过一些和 DB 结合的比较紧..
InfoQ 数据库架构采访文字修正稿
LinkedIn 架构与开发过程
关心 Web 2.0 的朋友对于 LinkedIn 应该都不陌生。我这个 Blog 上以前也介绍过 LinkedIn 的架构信息。最近, LinkedIn 公司的两位工程师在 JavaOne 上做了两个分享。揭示了更多 LinkedIn 架构方面的技术信息。
1) LinkedIn - A Professional Network built with Java Technologies and Agile Practices
这是我看到的 Web 2.0 公司中第一个完全拥抱 SOA 的。这个文档中大致描述了 LinkedIn 开发过程上的一些经验。
| View
News Service Architecture 对于国内鲜果这样的 RSS 工具网站或许能有点参考价值。另外一个值得注意的地方是架构的变迁,随着业务的增长,后端 DB 的变化非常明显。
2) LinkedIn Communication Architecture
这一篇中描述了几次迭代经验,其思路值得借鉴。
| View
其中提到了对 CLOB 字段的更新认识。我个人的建议是..
Linux 的 Out-of-Memory (OOM) Killer
时间:2008-05-27 10:04
标签:Linux Out-of-Memory 转贴摘录
同事在 Linux 服务器上遇到点小问题,我也上去折腾半天。这还是第一次注意到 Linux 这个多年来就存在的特性:OOM Killer 。说白了 OOM Killer 就是一层保护机制,用于避免 Linux 在内存不足的时候不至于出太严重的问题,把无关紧要的进程杀掉,有些壮士断腕的意思。
先要学习点老知识,在 32 位CPU 架构下寻址是有限制的。Linux 内核定义了三个区域:
# DMA: 0x00000000 - 0x00999999 (0 - 16 MB) # LowMem: 0x01000000 - 0x037999999 (16 - 896 MB) - size: 880MB# HighMem: 0x038000000 - <硬件特定>
LowMem 区 (也叫 NORMAL ZONE ) 一共 880 MB,而且不能改变(除非用 hugemem 内核)。对于高负载的系统,就可能因为 LowMem 利用不好而引发 OOM Killer 。一个可能原因是 LowFree 太少了,另外一个原因是 LowMem 里都是碎片,请求不到连续的..
提倡:用献血的方式捐骨髓
近日,广州市民大量涌向广州市的六大献血点,小编就此问题电话采访了广州血液中心的专家,进行了一些相关的咨询,专家也呼吁广州市民理性献血,把握献血时间:
目前广州市各献血点出现的情况主要有:
1、各献血点人太多,拥挤
专家建议:现在想要献血的朋友最好不要马上去献血点,目前每辆献血车的血液存储量只能容纳200人的血液,请想献血的朋友下星期以后再过去各大献血点献血,最近几天尽量不要去献血点。
2、广州血库目前各种血型齐备
专家提醒:目前广州血库各种血型齐备,暂时不存在某一种血型偏少的情况。
3、献血时请带好本人身份证
专家提醒:去献血的时候请务必带好本人身份证。很多去献血的朋友一时起意过去,发现未带身份证最后白跑一趟,所以特别提醒大家,带好身份证。
4、献血前注意休息
..
无知、愤青、无耻的人最近特别多。。。
5月12日的四川汶川地震,是我国的一个灾难。有良心的人,都会感到不舒服。但就在这个苦难的时刻,还有很多无耻之徒在发灾难财,在挑拨离间群众。这几天都看到很多,有如下:
1、短信
以儿女的名义,群发信息,说和同学外出,遭遇地震,手机和银行卡也丢了,希望父母将钱汇到一个不知名的帐号,说是同学的帐号
2、图片
以缅甸水灾的图片报称是地震的图片
3、文字
以捐款额来要求大家支持国货,反对洋货。但其中索尼中国昨天就捐了100w。但之后就有人说,才捐这么少。真无耻。如果外国的捐多了,就说人家显摆,捐少了,就嫌少。真tm难服侍。甚至还有人造谣姚明,真不明白这些人是什么脑袋的。
事后诸葛亮特别多。。。
2008年5月12日14点28分,我国四川省汶川地区发生了7.8级强烈地震。截止现在,死亡人数12012人,掩埋9千多人。
对此,网络上非常多的事后诸葛亮人士,均发表了诸多意见,例如国家地震局为什么不发布预报啊,为什么看到有大量癞蛤蟆突然涌到街面反而说是征兆等等,做出了非常严厉的批评。
对于这些人,我只能感到无语。首先可以提一点相关资料,根据凤凰卫视曾子墨的《社会能见度》在2005年做的一期节目,是关于唐山大地震的采访报道(上、下)。在71年开始的11年间,国家地震局的一个专家所带领的小组,一共做出地震短临预报175次。事后联合国组织对此进行打分评估,最后的结果是准确率为33.1%,“一个令世界为之震惊的数字”。由此可以知道,在当时的环境下,地震界根据周总理的指示“群防群治,土洋结合”,可以做出准确率为33.1..
Flickr Stats 功能的设计经验
时间:2008-04-28 09:54
标签:Flickr Stats 网站架构 转贴摘录
Flickr 的 DBA Dathan Pattishall 在前几天的 MySQL 大会上分享了 Scaling Heavy Concurrent Writes In Real Time (Record every Referral for Flickr Realtime) ,其中介绍了 Flickr Stats 的设计经验。国内好多 Web 站点其实也在设计类似的功能,只是不知道细节罢了。
数据结构原型
字段 数据类型 Path_query Varchar(255) PK Domain Varchar(50) Owner Bigint When Date Object-ID Bigint Object-Type Tinyint Counts and stuff Various ints May be some keys
主键是字符串,开..
eBay 的 Personalization Platform 采用 MySQL
时间:2008-04-23 09:25
标签:MySQL eBay Personalization Platform 网站架构 转贴摘录
过去写过很多关于 eBay 数据平台架构的帖子,过去eBay 的信息架构里 DB 都是采用 Oracle 的,大多数 DBA 朋友也都知道 eBay 在 Oracle 方面的技术搞得非常好。这次的 The 2008 MySQL Conference & Expo 披露出来的信息,eBay 在 MySQL 上做了很大胆的尝试,eBay Personalization Platform 就是用 MySQL 打造的。Sun 当然不会放弃这个大好的宣传机会(这两家在技术上的合作一向也比较多),所以年度最佳应用给了 eBay (一同获奖的还有 Virgin Mobile France 和 Facebook )。
面临的应用场景:客户端 Cookie 最大 4K,如果要传递更多定制化信息就不好搞了。作为电子商务站点,肯定有要为用户提供更具有关联性的商品信息的业务需求,这样就要跳出原有的窠臼。通过数据库集群来存储类似的信息就是有必要的,但 eBay 原有 Oracle 数据库上的压力已经很大。..
你好,Google Sitelink系列(上)
Google Sitelink是个让人高兴的现象,拥有Sitelink似乎是Google对网站主的奖赏,也是Google排名的最高境界了。
关于Sitelink的SEO文章不算很多,刚刚看了黑色梦中写的Google Sitelinks研究分析,Kyw也来说说切身体会。
记得上海SEO实验室在2007年3月份吧,Google搜索“上海SEO”排名第一,然后就一直非常稳定,Google时常有的小波动都没影响到这个关键词的排名。2008年3月份,发现Seotest在搜索“上海SEO”时获得Sitelink。
什么是Sitelink(站内链接)?
Google Sitelink我解释为:Google搜索结果内(SERP)的站内链接现象。看看下面这个截图,注意图中的文字和红框部分:
Sitelink的产生原因(Kyw版):
产生因素可能很多,众说风云,下面只是Kyw的体会,都是比较量化的指标了:
拥有Sitelink绝对需要符合的因素:
1. 网站..
Skype 用 PostgreSQL 支撑海量用户
时间:2008-04-08 11:49
标签:Skype PostgreSQL 网站架构 转贴摘录
自从 MySQL 被 Sun 收购后,相信很多对该收购不放心的朋友会转而看好 PostgreSQL 的前途。虽然比较大的 Web 2.0 站点数据库方案基本都采用 MySQL ,不过也有用 PostgreSQL 并且跑的不错的。今天看到 Skype Plans for PostgreSQL to Scale to 1 Billion Users 这个帖子,对 PostgreSQL 在大型网站应用上的部署算是有了一点了解。
Skype 在数据库上的横向扩展能力以 PL/Proxy 为基础的。其实几乎所有部署 MySQL 的站点也都在考虑 Scale Out (相比 Scale Up) 的扩展方案,也有 MySQL Proxy 这样的产品推出来,只是看起来还不够成熟。PL/Proxy 的设计思想类似 Teradata 的 Hash 机制,数据存储对客户端是透明的,客户请求发送到 PL/Proxy 后,由这里分布式存储过程调用,统一分发,示意图如下:
PL/Proxy 的设计初衷就是在这一层充当&qu..
