一些文章和各种资源
下面是近期收录的一些文章和资源,希望对你有用。
目录
系统方面
各种教程
Web库
HTML 5
编程规范
其它
系统方面
印度的电子商务网站flipkart的性能扩展(PPT) http://www.slideshare.net/sids/how-flipkart-scales-php,都是一些最基本的东西,对于初学者来说很不错。PPT做的也不错。
Tagged.com的扩展之路 – 1亿用户,1000台服务器,50亿的PV http://highscalability.com/blog/2011/8/8/tagged-architecture-scaling-to-100-million-users-1000-server.html 还是PHP的WEB站点。另外,highscalability.com这个网站上有很多和高性能有关的文章,很不错。比如最新的:Stuff The Internet Says On Scalability For September 16,  ...
Google 需要性爱
看到一篇趣文Google Needs Sex,翻译过来。
Brad DeLong 给我们写了 两篇关于“Google遇到的麻烦”的文章(墙),这两篇文章基本上是说, 制造网络欺诈和网络垃圾信息的人会尽其一切努力来和搜索引擎进行博弈,这样一来,其会让搜索到的结果对我们越来越没有帮助(译注:百度的竞价排名成为了制造网络欺诈和网络垃圾信息甚至洗脑的温床)。于是,人们开始去使用其它一些影响地较少的搜索引擎,准确的说,是那些垃圾信息和欺诈信息的东西还不适应于这些搜索引擎。
这让我想到了Sex。
如果你查看一下进化论,你就会知道为什么有性繁殖是有进化性的,是有可持续性的,而进化也是需要巨大的成本的。
为什么自然界不用克隆来繁殖呢?我所理解的最有说服力的答案是—— 防御寄生生物。如果每一代的生物体都和上一代完全的一样,寄生生物就总有一天可以破解生物体的防御,就是为什么!如果我们的某个香蕉园里种植着“克隆香焦” ,那么一旦某种病菌传播开来,那么我们整个香蕉园里的全部香蕉将毁于一旦。所以,混杂基因的模式会让寄生生物或病毒更难破坏我们的防御。
因此,Google的 ...
140个Google的面试题
来源:http://blog.seattleinterviewcoach.com/2009/02/140-google-interview-questions.html(墙)
某猎头收集了140多个Google的面试题,都张到他的Blog中了,主要是下面这些职位的,因为被墙,且无任何敏感信息,所以,我原文搬过来了。
Product Marketing Manager
Product Manager
Software Engineer
Software Engineer in Test
Quantitative Compensation Analyst
Engineering Manager
AdWords Associate
这篇Blog例举了Google用来面试下面这几个职位的面试题。很多不是很容易回答,不过都比较经典与变态,是Google,Microsoft,Amazon之类的公司的风格。对于本文,我没有翻译,因为我相信,英文问题是最好的。不过对于有些问题,我做了一些注释,不一定对,但希望对你有帮助启发。对于一些问题,如果你百思不得其 ...
Jeff Dean的Stanford演讲
Google 公司的 Jeff Dean 在Stanford大学做了一个非常 精彩的演讲(视频未墙)。我觉得我们每一个人都应该去看一看这个视频,当然,没有字幕,需要不错的听力,当然,我不可能全部翻译出来,因为我也不是完全能听懂,下面是一些相关的Notes,供你参夸,并欢迎牛人指证。
比较了从1999年到2010年十年来的搜索量的变化。搜索量增加了 1000 倍,而搜索速度快了5 倍。1999年,一个网页的更新最多需要一个月到两个月,而今天,只需要几秒钟,足足加快了5w倍。
一开始,这些大量的查询产生了大约30GB的I/O量。2004年,他们考虑过全部重写infrastructure。
讨论了一些关于变量长度字节对齐的东西。
今天的MapReduce 有400万个作业,处理将近1000PB的数据,130PB的中间数据,还有45PB的输出数据。(1PB =1024TB)关于 MapReduce (Google云计算的精髓) 的一些统计,见下图:
现在Jeff正在做一个叫Spanner的项目,这是一个跨多个数据中心的项目。在后来的Q&A中, ...
中国仍然是一个很穷的国家
Google最近发布了一个全世界可以开放查询的数据平台,其中包含了多种宏观数据,并且有很方便的作图方式。
http://www.google.com/publicdata/directory
其中有一项是世界各国人均GDP
虽然最近一些中国城市房价已经超越我们的想象力,但是从这张图里还是可以看到,我们仍是一个人均非常穷的国家。
分享:我是如何使用Google Reader的
相信不少读者都是通过Google Reader (貌似没有中文名) 看到本文的,而多数Google Reader的爱好者都是贪婪的。如果你像我一样,估计未读数量从来都是1000+。遇到强迫症就麻烦了。下面一个方法能让阅读变得有“轻重缓急”。
承认不是所有种子一样重要,有些更新你想立刻知道(例如某新闻类的博客:古奥),有些只是希望不要错过(例如某经典博客:Joe l on Software),还有一些可能只是娱乐用的(例如:煎蛋)
Reader是可以为种子建文件夹的,所有“重要而必读”的种子都可以放在一个文件夹里,文件夹的名称最好是用“_” 开头,这样排序的时候可以在最前面(见图解)
每当打开Google Reader的时候,先看重要的种子即可,其他的有时间再读。
笔者的Reader界面(献丑了)
Google Maps API用法教程
在过去的一年中,在线地图的发展是相当巨大,我们可以看到在线地图的极有价值的信息和其能力。这其中,最有名气的自然是Google Maps。. Google Maps由一个相当强大的开发引擎并也有一个很大的社区提示支持。
Google 允许各种web masters 通过Google Maps API来增加或自定义他们站点特定的地图,你可能从这里取得Google API key 。一个地图 API key只对一个“目录”或域有效。key绑定了你的域名,你要在网站上放地图,需要有对应的key,否则拒绝读取地图数据,在本地测试可以不用key。当然,你可以申请多个API key。
目录
创建一个简单的地图
地图标记
活动标记
加入多个标记并分组
过滤显示标记
创建一个简单的地图
在你的站点上引入Google Maps 是一件很简单的事情,你只需要加入:
引入Google的JavaScript 文件
设置JavaScript 一些参数
一个你需要显示地图的HTML layer
Google的Javascript文件引入 ...
微软在从Google赢取搜索引擎市场份额
7月到8月,微软市场份额从8.9%到了9.3%; Google掉了1.7%
Bing显然让Google有些紧张,不仅Bing在界面上赢得了一部分消费者的好评,而且其在某些垂直领域的深度整合使得Bing的盈利能力具有了相当竞争力。相信Google在幕后紧锣密鼓的测试新界面和新搜索功能的同时,也在严阵以待地部署销售团队(如果经济萧条好转,旅游和健康将会是最先复苏的领域,也是Bing目前占有优势的战场)
拭目以待吧!
原文地址:http://news.bbc.co.uk/2/hi/technology/8268356.stm
Microsoft increases search share
Microsoft’s Bing search engine is making inroads into Google’s dominance of the search market according to data from US net measurement firm ComScore.
Its latest figures show Microsoft’s share of t ...
如何知道某网站运行在GAE上
GAE就是Google Application Engine,通过Alexa的网站排名系统,我们可以知道Top 10的使用GAE的网站,他们是:(截止至今天)
1. www.robtex.com (Alexa rank: 1691)
2. www.twibes.com (Alexa rank: 13143)
3. www.acid-play.com (Alexa rank: 25884)
4. www.jaiku.com (Alexa rank: 29061)
5. www.wordle.net (Alexa rank: 34022)
6. www.twazzup.com (Alexa rank: 40910)
7. www.twollo.com (Alexa rank: 41414)
8. www.downforeveryoneorjustme.com (Alexa rank: 41718)
9. www.chromeexperiments.com (Alexa rank: 49899)
10. www.desktop-reporting.com (Alexa rank: 5144 ...
Google 三维 JavaScript API 发布
O3D 是一个开源的Web API,其可以创建相当牛X的基于浏览器的可交互式的3D应用。这个API在很有可能会形成以后的Web上的3D图形的标准。下面是这个API的主站点: http://code.google.com/apis/o3d/ 。O3D目前支持Windows, Mac和Linux三种平台。
下面是一些简单地使用O3D的API的如何创建一个立方体,更详细的内容请访问O3D的网站。
1)首选我们先创建一个比较原始的立方体。使用createCube()方法。
[javascript]
function createCube(material) {
var cubeShape = g_pack.createObject(‘Shape’);
var cubePrimitive = g_pack.createObject(‘Primitive’);
var streamBank = g_pack.createObject(‘StreamBank’);
cubePrimitive.material = material;
cubePrimitive.owner(cube ...
如何在Google App Engine上运行PHP
Google 在一年前发布了Google App Engine (GAE) 。这是一个免费的 App Engine 主机,可以让你的每个Application(免费的最多有10个)有1GB的磁盘空间和43.6个CPU小时与10GB的上传和10GB的下载带宽,以及2000个电子邮件。如果你需要地更多,那就是付钱了。
GAE 最近发布了正式支持Java的通知。于是,互联网上开始有了各种各样的BLOG评论文章,还有一些人居然在Google App Engine 中运行PHP程序,这个太不可思议了。因为GAE目前并不支持PHP。
其实,他们使用了一个叫做 Quercus的东东, Quercus 本质上是一个 100% 的用Java 实现的一个 PHP 引擎 (需要 JDK 1.5),所以,只要你把Quercus集成到你的GAE中,你自然也可以运行PHP脚本了。
下面是大体步骤:
1) 注删一个 免费的帐号。
2) 下载这个文件 到你本机。
3) 在 war\WEB-INF\appengine-web.xml 编辑 ...
【引文】如何用Python往Google Spreadsheet上写数据
现代企业里,数据决定着方向,人们都想随时看到各种报表。很多项目可能都需要dashboard一类的工作,把分散的数据变成一些能随时查看实时数据的图表,这个工作有两个环节:
把数据汇集起来,放入CSV或者数据库
一个服务器端的程序能够读到这写数据,根据需要生成在线的图表 (离线的也可以,那样每次人们想看这些图的时候都会来麻烦你,如果你在度假,他们会想敲开你的电脑)
第一步可以通过定期跑些脚本完成,但是第二步有时候就不太容易了,如果你希望你的图表能够让所有人方便随时查看,最方便的给出一个URL能让人随时访问,Google的在线文档可以提供一个简单的解决方案。
但是,如何将数据自动弄到在Google spreadsheet 上呢?手动的copy/paste是一个方法,但是很费人工,最简单的方法就是写个脚本把这个流程自动化。如何将数据写进Spreadsheet (在线表单)呢?请参考下文:
Write to a Google Spreadsheet from a Python script
注:这是个搜索方面比较大拿的Googler的博客。
资源推荐: Google Code University
如果你的专业课里有过不少计算机科学之类的内容,你可能还记得很多中文课本不太好读,其原因一方面有可能因为是课本里的语言(符号)粗制滥造,另一方面有可能是因为你的思维方式不适应课本里的内容。
我推荐所有能看懂英文的读者多去搜索一下英文世界里的教材,从而能够摆脱劣质教材或语言因素所带来的束缚。为什么推荐英文教材呢?大家可以参考一下英文教材编写者(计算机科学界大儒,图灵奖得住) Dijkstra对于自己写作上的要求:
At a given moment, the concept of polite mathematics emerged, the underlying idea of which is that, even if you have only 60 readers, it pays to spend an hour if by doing so you can save your average reader a minute…
翻译:任何时候,你(作者)在书中要解释一些带有数学成分的概念,你(作者)应该有这样的理念:哪怕这个内容只有60个读者,(作者) ...
读后感:房间里的大象:Google文化成为主导
一篇有关Google在互联网市场已经造成垄断事实的文章。
这里有个有意思的英文常用表达: elephant in the (living) room (房间里的一只大象),一般用来表达事情已经大到没办法睁一只眼闭一只眼了…例如:
丈夫开始拿单位里年轻的姑娘的照片当壁纸
公司虽然已经没有说要裁员,但是已经开始停止供应免费的厕所手纸
我再举例子可能就有人要扔砖了
互联网公司(不久的将来会延伸到很多非互联网公司)的成功,已经越来越依赖于自己能不能被搜索到,不能被搜索到的网页其实也就相当于不存在。而文中所点到的是一个大多数人已经知道的事实,那就是Google已经成为这个渠道无可厚非的“独裁者”。如果你是一位网站管理员并有系统的方法(例如:Google Analytics) 统计用户的来源,你大概会明白这其中的比例 (如果你没有统计方法,估计你在向管理层要预算的时候很难量化)。下表是一个叫 Stack Overflow的网站统计的一个月内访问自己网站的用户中搜索用户的分布:
Search Engine Visits
Google &n ...