我就是个做网站的

你有没有想过为什么你登校内的时候,输入你的帐号密码,进的是你自己的主页,而不是别人?

你有没有想过为什么你用百度,用google的时候,你只要输入一个字,搜索引擎就会给你列出你可能要搜的词?

你有没有想过为什么你用不同的浏览器上同样的一个网站,效果可能有很多的不同。

你有么有想过为什么你玩游戏的时候,不是次次爆件,个个神装?

你有没有想过你点击一个“确定”按钮,信号来回走多少步?

这些东西不是凭空出来的,不是电脑自动生成的,是做软件的人,一个字母字母敲出来的。

其实,在你上网使用一个很简单的功能,它背后都可能使用很深技术。

HTML发展了这么多年,中间经历无数的标准,无数的协议,无数的新技术,才发展到现在的程度,由它能延伸出DOM,Javascript,FLEX,jsp,AJAX……太多了,不数了。

但用户不会知道,也没有必要知道,需要知道只是如何双击IE,键入网址,点击超链接,去看他们感兴趣的东西就可以了。

这些都没有问题,任何问题都没有。

有问题的是,“学技术的人最悲哀的是常常会被一点技术都不懂的人去管”。

这话我是常说的。

一个企业的管理层,绝大多数都是不懂技术的,他们不会考虑这个技术如何特殊,不会考虑浏览器之间兼容性问题,他们要考虑的是这个提案有没有市场价值这种在技术人员看来很“无趣”很“不理想化”的问题。

但,在中国,一个公司里赚钱最多最有名的一定就是那个最不懂技术的人,比如史玉柱。

也许你会说,工地的民工也不容易,也很辛苦,一栋楼盖完之后,没人会想到他们。嗯,对,所以我要告诉你,程序员和民工的区别就是民工按小时收费,程序员按月,除此之外两者没有什么不同。

上上句话里,特意加了“在中国”,就是因为觉得在中国,程序员是很不受待见的。但在国外却不是,比如你能随口说出一个世界上最有名,最有钱(现在可能不是了)的程序员,比尔盖茨。

(不写了,越写越郁闷)

ps 本文就是发发牢骚,没什么层次段落。

再ps  许个小小愿望:以后能找个能理解我工作的女朋友就好了~

 

—2009-09-10

我们是程序员

程序员绝不是商人。

程序员想的是如何将程序做好,但不会去考虑怎么将自己的程序卖出去。

欣赏求伯君。

在网游大潮席卷中国,各大公司都纷纷争先恐后的代理国外大作时,求伯君说:我们是程序员,所以与其用别人的东西,还不如我们自己去编一个网游出来。

我们是程序员。

我们是搞技术的。

 

现在的X0后没有经历过DOS,WPS,Win3.X,KV300。

怀念黑底白字的“命令提示行”。

怀念256色可谓艳丽,

怀念单声道的天籁之音。

怀念……

 

WOW,QQ,JW团……这些商业化的产物已经侵蚀掉了那个由程序员所创造的时代。

那个单纯的时代。

 

在程序员眼中,要考虑的是WOW的3D引擎。

在程序员眼中,要考虑的是QQ的通讯协议。

在程序员眼中,要考虑的是JW团的上下左右键盘点击事件。

 

在程序员眼中,这些仅仅是一个个程序,一段段代码,一对对二进制01符号。

 

而不是世界第一网游,

而不是中国第一IM软件。

而不是中国第一yiyeqing温床。

 

时代已经抛弃单纯的程序员了。

时代要的是能让玩家发泄的东西,心理上的发泄,身体上的发泄。

所以上帝派来了史玉柱这样的商人,JW团这样的网游。

史玉柱赚着大把大把的钞票,玩家发泄着大把大把的郁闷。

两厢情愿,皆大欢喜。

 

角落里的程序员依旧不修边幅,昼夜颠倒,三餐泡面,目光呆滞。

盯着昏暗的屏幕,敲着代码。

 

我是程序员,我仅仅是个程序员。

仅仅是。

 

—-2009-03-26

基于图像识别(神经网络)的微信朋友圈抓取(1)

(学完深度学习之后,最开始想做的是一个朋友圈预测,但是第一步数据收集就卡住了。微信朋友圈没有什么接口开放出,只能一个个的手动粘,极其耗时,粘了几十条之后,就不爱弄了。)

(网上也有人问,但没什么有用的答案)

突然想到,可以换个思路,完全可以用图像识别的方式去“看”,哪个部分分别是什么,然后通过模拟器点击去抓取存储:

1613999874.jpg

(图片来自本人的iphone6sp截屏)

简单的划分一下:

  1. 最左上角是个“完成”按钮
  2. 接下来是个“头像”,旁边是“昵称”
  3. 下面是“文本段”,可能没有,长度也不一定
  4. 再下面是“图片”,单张图片,会全部显示,多于2张的,会是缩小图,图片也可能没有,最多9张
  5. 这里还有可能是别的内容,比如网页的分享,或是小视屏
  6. 如果这里是从别的app分享过来的,下面还会有“来自哪个app”
  7. 再往下是“发布时间”
  8. 再下一点可能是评论回复,这个截图里面没有,长度和数量不确定
  9. 最下面是回复框

基于以上分析,有些区域的位置其实是固定的,比如“完成”按钮,“头像”,“昵称”(昵称的长度可能不确定,但基本就是在那一行上)

往下是重点,内容分析:“文本段”,“图片”,“小视屏”,“网页”,每一个都有自己的规则,其实规则还挺好找的,放之后慢慢说。