6/28/2006

勘误

当年曹操很痛苦的时候,写了个短歌行。说:“对酒当歌,人生几何。譬如朝露,去日苦多。”为什么苦,写得隐晦。

今天晚上呢,midi也很痛苦。因为科研没进展呀没进展。就来博一搏,写个勘误。

勘误之前,唠叨两句。
越来越觉得科研这件事,很像赌博。你做的题目,也许很有意思(当然大部分是没意思)。但是能不能有结果,没人敢拍胸脯。说的好听点,叫做科研有风险,介入请小心。牛导师和好环境的作用,就是帮你减小风险,排除万难,把你抬到他们肩膀上。自从认识到了这一点那天,迷笛就跑去买了彩票。乐透。一样是赌博,分摊风险胜率会不会大点?heeeee~~~

好了好了。勘误是关于战神。
前两天不是写了一个“战神雅典娜的光芒”么。
东子和fangliang先后提醒我,古希腊和罗马神话里面的战神都不是雅典娜。
应该是一个叫做mars(罗马)或者Aris(希腊)的家伙。初中的时候,被朋友送了一个英文版的古希腊神话。可是英文太烂,他们之间的关系又太糜烂和复杂,于是一直都没有看清楚。反倒是看“特洛伊“和“奥塞罗”种下了雅典娜是战神的印象。那天去search了一下,很罕见的也看到了说雅典娜曾经是战神过的一个说法。但是整体上。战神雅典娜,还是不准确的。特地勘误一下。也多谢大家提醒:)

关于mars,最清楚的反而是《战神》。没错,就是日本漫画战神,然后被台湾拍成连续剧的那个。它的slogan是:
MARS——带领人们冲破悲剧的黑暗英雄。

图一,突然发现仔仔这张图跟迷笛最近的偶像韩寒有点像。。。


图二,很喜欢的一个大配角,神经质加被迫害狂。这张为什么赞,因为太像漫画了!!

6/26/2006

香水百合

TS290432


当啦啦啦还是纯情小女生的时候,她的昵称叫lily,而不是啦啦啦。
因此也得到过恋爱中男子所赠的白色百合。


被243的众位养在罐头瓶里。

可见浪漫大抵还是件很麻烦的事。所以男生们如果你们要送花,请先观察一下对方有没有花瓶。如果没有,选择送捧花,再不然附一只花瓶。

而且当花苞们终于,纷纷怒放的时候,寝室里整日充满了奇异的味道。你也没法说它是香,或臭,不可言;以奇异带过。

百合在我的脑海中整体得分为负。

TS290430

挺久以前,去看了一次百合展。走着看,始终觉得比起百合,还是更中意郁金香,婷婷的。百合还是透着股子张牙舞爪的的自满和俗气。直到在出口碰到一盆盆的香水百合。



没想会是那样的香气,站在其中,竟仿佛被它们宠爱着。于是散发着这样香气的百合,立刻变得可爱优雅起来。



注:

白香水百合,英文名CASABLANCA。中文英文都很浪漫的样子。
号称花语有七种:
[1]伟大的爱
[2]一种充满回忆的花,淡泊的永恒
[3]易变的心
[4]不要放弃一个你深爱着的人
[5]死亡,盛开的很傲然,厌世的花
[6]永恒的美
[7]负担不起的爱

看来可以视情况而定自行选用。要怎么解释就怎么解释,很便利。^_^


TS290431 TS290429

6/21/2006

惠比寿手机snapshot-告诉你一个真正的日本

好,看了这个题目的兄弟姐妹,先深呼吸一下,用三十秒对着天空大喊三声:
恶俗!!
恶俗!!!
恶俗!!!!


如果还觉得不解恨,那这样够不够?


/ \ / \
| \ / |
| ︵ \ / ︵ |
\︶\︶\︶|︶| \ \ / / |︶|︶/︶/︶/
\ \ \ | | ︶ ︶ | | / / /
︶ ︶╰| | | |╯︶ ︶
|︶| |︶|
| | 鄙视你! | |
︶ ︶


(转自未名ascII艺术版)

不过呢,最近“告诉你一个真实的日本”类似的题目被炒的还蛮火的吗,随便拿来用一下。大概文不对题,但想来大家对文不对题也习惯了。^_^


先介绍一下背景。
周末的时候东京的pkuers跑去惠比寿(为什么我和小nail之前都觉得那个地方叫做惠比寺)一个中国饭店吃饭。
我和wangyin,DN最后做为留守做在正对惠比寿车站门口的长椅上等后到的人们。

漾在初夏的濡风中,看走走过的红尘男女。(因此也实际上一个人都没有接到,大家都很坚强的自己找到了饭店。)周围很嘈杂,掩盖了手机拍照时咔嚓咔嚓的声音。因此此次成了是迷笛用手机偷拍最爽的第一次。
拍到的不是典型,只是路人甲乙丙丁。:)大家看看笑笑而已,以后努力提高。

下面就要发图了哦。














发图之前,再祭起一件宝器, picasa2!(迷笛抱头鼠窜中)
以前装了试用了一下又卸载,这次google推出了在线album,因此又下了最新的来再次试用。发现我人生的大部分时间都是在blog中度过的。可谓人各有志啊。。


证明一下真的是日本,俺们不弄虚作假。这个绿牌子是日本的Japan railway (JR),惠比寿站。
ebisu eki

日本mm真的很少用非常艳的颜色。直接导致迷笛刚去日本的时候觉得自己是万灰从中一点红(或者黄,或者粉,或者绿)。 对不起,这两个妹妹质量不是很高。将就一下。。。
TS290444

其实走路看书的也很少,刚才整理照片的时候发现这张也很诧异。走路吃东西,喝水,打电话,看书大概在东京都被看作是失礼的举动。
TS290439

这个感觉不错。可惜只有背影
TS290438


来两个男的。
TS290440
下面这个,我实在是不想叫他猥琐男。。。收拾的本来还成,如果换一个角度一个表情也能勉强po出来骗妹妹的。再次证明拍照角度很重要。
TS290443


注意一下那个穿黑裙子的妹妹。据熏仔说,今年109满眼这样长度的裙子(迷笛不混109很多年了)。
在惠比寿果然也是比比皆是,经典的搭配是长裙+无袖低胸(瘦版篮球背心装……)tshirt。有的妹妹穿的很赞的!迷笛不停在斗争啊,每天要告诉自己一千遍,“不许买!穿上了会变粽子!”
TS290442


好了,到这里拉,大家晚安。:)

6/19/2006

NOTE: Generality In Artificial Intelligence


(This blog will be written in my shabby English, sorry for that in advance...because otherwise, it will become a mixture of Chinese explanations with English citations...)


1. John L. McCarthy. Generality in artificial intelligence. Commun. ACM, 30(12):1029--1035, 1987.


It is really great to look back into the classical papers, and 1 is one of them.

Well, I know something but they are in a mess. In this paper, the knowledge pieces in my mind are tied and positioned to the right place. And, by looking back we can tell what are the basic problems and which of them have been solved, if not, what are the contributions. Most importantly, Issues discussed in the Semantic Web community can also find their originals here.

About the Semantic web. We know stanford KSL lab has contributed a lot (e.g. ref. the work of Dr. Thomas R. Gruber and Dr. Deborah L. McGuinness ), where Prof. McCarthy worked for 40years.
Some ideas explained in these paper are still being explored by SW people.

Make some notes as follows.
-----------------------------
1.Horn clause & prolog
-----------------------------
from wikipeida
from StarJumper

-----------------------------
2. Situation calculus.
-----------------------------
Have met them before in PKU, in the lecture given by Prof. Zhuoqun Xu on Artificial Intelligence.Got to know it from the the book: A modern approach, artificial intelligence. And now I know why it is proposed, and what does it mean for AI.


-----------------------------
3. Qualification problem &
frame problem.
-----------------------------
-> circumscription.
[todo]

-----------------------------
4. Reification
-----------------------------
reification is a mechanism provided by RDF. Also there is a long discussion about it in the mailing list of rdf and topic map.
Why reification is important? In RDF is means that one can say something about the predicate. And in 1, the section of Reification begins with:
"Reasoning about knowledge, beliefs, or goals requires extensions of the domain of objects being reasoned about..."
and in the example, "and predicate constant.... is taken as an object in the first order language.."


-----------------------------
5.Notion of content
-----------------------------
AI people is always facing with the "close world problem": "Whenever we write an axiom , a critic can say it is true only in a certain context. With a little ingenuity, the critic can usually devise a more general context in which the precise form of the axiom does not hold. Looking at human reasoning as reflected in language emphasizes this point."

And a proposed possible "way out involves formalizing the notion of context an combining it with the circumscription method of nonmonotonic reasoning."

The idea of context is: a sentence is meaningful in particular context.
With the conception that ontology is an "agreed specification", I redirected my focus to context and ontology.
There are a lot of related work already(C&O, 2, 3 ), and seems it is attracting more and more attention from SW.

[todo]Problems and Projections in CS for the Next 49 Years



-------
2. Aberer, K., Cudre-Mauroux, P., Ouksel, A.M., Catarci, T., Hacid, M.S. Illarramendi, A., Kashyap, V., Mecella, M., Mena, E., Neuhold, E.J., Troyer, O.D., Risse, T., Scannapieco, M., Saltor, F., De Santis, L., Spaccapietra, S., Staab, S., Studer, R. (2004). Emergent Semantics Principles and Issues. Database Systems for Advanced Applications 9th International Conference, DASFAA.

3.Mika, P. (2005). Ontologies Are Us: A Unified Model of Social Networks and Semantics. International Semantic Web Conference.

可怜的pagerank

Google PageRank Checker - Page Rank Calculator Google PageRank Checker - Page Rank Calculator Google PageRank Checker - Page Rank Calculator Google PageRank Checker - Page Rank Calculator Google PageRank Checker - Page Rank Calculator

msn space的域名变了下样子。迷笛就欲哭无泪了...
以前的http://spaces.msn.com/midiblog,pagerank已经到了4/10的。正信心满满的向5冲击。突然域名变成了http://midiblog.spaces.msn.com。
于是辛辛苦苦一整年,一夜变回解放前:
pagerank变回零!!!!!!!!!!!!!

我们不靠欺诈,不交换连接,每一个point都是自己诚实劳动赚来。这样完全丢失简直是恨得满口银牙咬碎(还得含血吞)。实在是搞不懂ms在干吗,messenger上的icon换得到很勤,space的图标变得很像ubuntu的图标,翻译成中文就是“网聚人的力量”,大概是想做SNS。邮件的icon变成calendar的样子,难道是想做在线日程。功能做齐了再换图标嘛,现在就把远大理想告诉我干嘛,好大喜功的典型。但space的编辑和切换就慢得像蜗牛。

ms live的举动很有点意思,似乎在学习后辈们“永远的beta版”的样子。目前看来还是不得要领,没学到家。永远的beta也不是没想好就做,不好了又换回来好不好。

不知道google重复同名url的辨识处理机制,能把两个联系起来。哪怕迟几天呢。

又去查了一下blogspot上的blog,还是三。哎。没人气就没rank啊。

6/18/2006

关于足球的三言两语




世界杯期间,伪球迷们都跳出来说话了;而真球迷们都纷纷在忙着看球或者睡觉.

**************
关于荷尔蒙
**************
早在世界杯开始前一个月,我就想好了某个blog的开头:今年的六月,连空气中都充满了男性荷尔蒙的味道。

怎样?多莫性感的、能够提高blog点击的一个开场白。。。可是真当世界杯开始了,我发现这个性感小短句完全无用武之地嘛。没事问了问周围的男生,大概40%表示完全不关心;剩下的60%中又有一半是无所谓,看就看、不看就不看;那么总共觉得应该看的.只有男生人数的30%。
这30%中,真伪球迷良莠不齐,那他们被世界杯所激发的荷尔蒙简直一定变成空气众多分子中的无穷小量省去,gone with the wind,哪里还感觉得到...

难道是我的样本空间出了问题?

那些,
曾经顶着第二天期末考试的压力,在燕园学三彻夜看球叫好的男同学们。
你们也都在哪里那。
也已经都老了吧。
(版权声明:抄"那些花"句式)

可是我还是会为那些热爱世界杯的人们着迷。总觉得成人能够那么忘我的投入到一场游戏中,也是需要写单纯的稚子之心吧。而因为这样,平时平庸到憎恶的脸孔,也能生动可爱起来。


**************
延迟
**************
都是世界转播,我们现在才知道,日本的转播和中国的转播是不同布的。
现场拉拉队的声音被过滤,是比较好理解的。。无厘头的是竟然还有延时。中国的节目大概会慢五分钟。总不会是差了一个时区的原因吧?

开始我和小刚并不知道。我大声喊“阿~~~好帅~~~~”的时候,小刚同学要五分钟后才看到现场。那感觉,就是wanghao有一天的昵称:“憋着一天不看新闻,却在MSN的名字上看见比分的痛苦”。因此迷笛被勒令不许提前喊出进球消息。可是,忍也是会忍出内伤的。

世界真奇妙,不看不知道。



**************
足球宝贝
**************

看了很多的足球宝贝,这一组让我很心动。前几天已看到,就决定要那它来用了。不知道会不会被女权主义斥责?欢迎指正和讨论。

别的足球宝贝的图片,就是脱了衣服的模特儿抱着足球。你可以把那个球换成任何东西:脸盆,洗面奶,马桶刷——

但是这一组就不同。执著,野心,坚韧,放肆以及睥睨天下,更多性别而外的中性元素被表达了出来,但又没有失去女性的美感。所以迷笛很喜欢。虽然不是每张都不错。

当然淫者见淫啦,如果只看到大腿臀部小腹和胸,我也没办法。当然,平心而论,很pp。
(所以,我在想,有没有人做过这样的试验,证明女性更容易欣赏对方,因此也更容易变双性恋或者les。)

今天搏的尺度真够呛,一边擦汗一边小心翼翼的电击那个“发布帖子”的按钮。

6/16/2006

就让战神雅典娜的光芒

陪伴我度过这个黯淡的六月。




晚上跟朋友们说话,都是:“我去雅典娜了。”

大家都很聪明的心领神会,多莫美妙的世界。

看球学日语:gohan

日本对澳大利亚那场,听到最多的是gohan...两个字.
解说员,赛后的队员记者会.大家都在说.

我就奇怪了为什么揪着"御饭"(也就是大米饭)不放呢?
难道是在德国受到了不公平的待遇,没给吃饱饭?这个照理说,是中国队经常得到的待遇啊.原来是连带着亚洲球队全都被歧视...

嗯...存疑

直到今天,又听到gohan,才突然天雷地火电闪雷鸣地明白.人家!那个!应该是:
后半!!!后半场的简称.


服了我自己...

6/14/2006

NOTE: String distance metrics

for
William W. Cohen, Pradeep Ravikumar, S. E. F. (2003). A comparison of string metrics for matching names and records. the Workshop on Data Cleaning and Object Consoliation.

and
http://secondstring.sourceforge.net

1.edit distance: (the differences in position matters)

  • Levenstein distance
  • Monge-Elkan distance
  • Smith-Waterman distance
  • Jaro smilarity distance

2.token based ditance (strings are deemed as multisets of words)
  • Jaccard similarity
  • TFIDF (cosine similarity)
  • Jensen-shannon distance
  • FS (fellegi and sunter) distance

3.hybrid distance (a combination of token-based and string based metrics)
  • a variant of Monge-Elkan distance
  • softTFIDF

6/13/2006

NOTE: Blocking methods for record linkage

1. record linkage:
http://en.wikipedia.org/wiki/Record_linkage
Record linkage also known as deduplication, refers to the task of finding entries that refer to the same entity in two or more files. Record linkage is an appropriate technique when you have to join data sets that do not have a unique database key in common. A data set that have been through Record linkage is said to be linked.

2.Blocking methods
are used in record linkage systems to reduce the number of candidate record comparison pairs to a feasible number whilst still maintaining linkage accuracy.

Blocking methods partition the data sets into blocks or clusters of records which share a blocking attribute or are otherwise similar with respect to a defined criterion.

e.g. from [ref2.]
standard traditional blocking

sorted neighbourhood blocking
bigram indexing
canopy clustering with TFIDF



----------------------------
ref.
----------------------------
1) Ivan P. Fellegi, A. B. S. (1969). A theory for record linkage. Journal of the American Statistical Association. 64: 1183-1210.

2) Rohan Baxter, Peter Christen, A. T. C. (2003). A comparison of fast blocking methods for record linkage. ACM Workshop on Data Clearning, Record Linkage, and Object Identification.

6/12/2006

google: 世上没有免费午餐,问题是要多大代价。

抽空写两句。

前两天跟DN说起来google怎样全方位掌控着个人隐私的问题。比如他就不用google的canlendar。而我就觉得无所谓。

你用了google的“免费”服务,总是要付出点什么的。(世界就要这么运转,哪能天上掉馅饼不是。)我付出的,就是我输入的关键字被它跟踪,刻画我这个人的爱好;我的邮件上下文都在gmail中;我的日程表为google内部工作人员可见。这就是我与google 签订的隐含协议:出卖我自己,买来些服务。

你用hotmail,用yahoo,用baidu,都是这样。但我只跟google做这样的买卖。因为它说,dont be evil,而且也在这么做。

美国政府向yahoo, AOL,微软, google要求搜索数据,只有google拒绝。大家就可以理解google是如何的难得了。
在前者的合同条款中(也许写在那个谁也不会读的服务条约中,也许没有),“你”的信息被完全卖给了全世界,它们可以为所欲为。而在google的合同中,只是和google在做交易。两相比较一下哪个买卖更划算一目了然。

也正是如此,当google.cn开始为了进入中国提供经过过滤的信息时,人们才那么的焦虑以及不安。因为,在原则问题上退一步还是一百步,没有区别。换句话说,同样是我的个人资料交出去,买到的信息不是本来的样子。已然隐隐让人觉得有些亏本。况且,能在提供信息上让步,就未必不会再信息保密上让步。大家都不是傻的,看看itwire上给的统计数据“... Brin told Reuters that only 1% of Chinese users accessed Google.cn with the rest going to Google.com.”

更新的报道是“Google创始人考虑抛弃谷歌,策略与理念冲突”当然我不知道这个声明背后是什么原因。可能是因为作了让步的google仍然时不时受到GFW的干扰屏蔽,所以放些话来造势和谈判?或者像连岳说的:“Google也许知道了没有"半人半奴"这种选项”。我不要求google一贯正确,但很欣慰看到他一直坚持自己的原则。

等到他放弃原则的那天,就是我开始放弃google的那天。

希望那天不会到来。

6/08/2006

Magic Cube!


实验室的法国佬原来是一个魔方高手。据说在四○多秒之内就可以拼好六面!!

让他demo了一下,zmazing!运指如飞。我很想录下来他拼魔方时候的状态放到blog上……

小时候我有过一个魔方啦。我总是先拼一面,然后想拼另一面,似乎从来没有把两面都拼好过。(印象里有一个小姨夫,拼出过两面。不知道是不是记错了)所以最后那个魔方的结局是,被我一块一块的掰下来,再重新安上,做成一个完美的六面。以后就以此为乐了,魔方被我找到了新玩法!0(^_^)V

我要不要告诉那个法国人,我能在四十秒的时间中把魔方拆了再装好?

今天才知道魔方的正确思路:先拼一面,然后拼紧接拼好那个底面的一条变,然后是之上的第二条边,然后是最后一条(连同上底面)。打个比方,就好象我们编一个笼子那样。原来我一直以为魔方是一个面一个面的拼的!

今天试了一下,可以很顺利的拼好底面和第一条边,过几天去攻克下一条。网上有很多教程来得,不过我决定先死磕死磕再看。

又刺激了我的购物欲:去tokyo hands,买个魔方。:)

无奈的JOKE&联想与微软联手



今天发现donews的很多blog侧拦上都都出现了一个扎针小人图。原因在这里



似乎是因为G F W又让很多国内的用户不能访问google.com, gmail,gtalk了。跑去问了问jjgod和lulu,他们都用的很正常。不知道到底波及的范围有多大。但是看到大家沸反盈天的,估计也不是无中生有。

跟lulu小讨论了一下,说到大家为什么每次一被ban就这么群情激昂。我比较认可的结论是,google除了很好的服务之外,更被(中国的)用户赋予了“平等”,“正直”等等这样的意义。所以google的服务被ban一次,就身临其境的感觉自己的权利就被褫夺一次。(大概也是因此,谷歌这种妥协的做法,让大家都感到无奈的愤懑吧。)

看到水母上转来的帖子:八荣八耻救谷歌
---------------------
八荣八耻救谷歌
[本篇全文] [本篇作者:jiangxz] [进入讨论区] [返回顶部]1发信人: jiangxz (robert), 信区: Google
标 题: 我上google由被盾到解盾的经历
发信站: 水木社区 (Sun Jun 4 14:35:54 2006), 站内

这两天老是上不去google,用了好几天baidu.
刚刚看版上有人gmail用不了,网友提议url里加上"八荣八耻"之类.
我用的是maxthon,在搜索框里加了个"八荣八耻",然后按shift+enter
解盾了....看来真有白名单呀.哈哈.

---------------------

其实我每次在这里很自由的访问任何网站的时候,就会不由自主的忆苦思甜,想起在学校时候为了去访问google等等晕天黑地找代理的日子。:)

又,看到联想的新动作:
联想全力支持微软 所有PC机不预装Linux

前两天看到杨元庆跄天哭地的让政府出面帮忙解决进入美国市场的问题。
现在就看到了一个新的尝试:在关键的时候想到和微软联手。这到让我有些刮目相看了。目前我也没有什么评论,些许赞赏的保持持续关注中。

6/06/2006

About rdfs:member

0. rdfs:member in RDF vocabulary
rdfs:member:"is an instance of rdf:Property that is a super-property of all the container membership properties i.e. each container membership property has an rdfs:subPropertyOf relationship to the property rdfs:member."

ReferTo: RDF Vocabulary Description Language 1.0: RDF Schema

1. rdfs:member with protege
Recently, I am trying to build a domain ontoloy with protege version 3.2 alpha. To reserve the full expressive capability, the project is set to be
owl full. Then I

  • 1) created a subclass of rdf:Seq. with the name, for example, Myseq.
  • 2) tried (and failed) to and add constraints on rdfs:member property.
    By definition, the range of rdfs:member is rdfs:Resource. But I want to constrain the resources joining that property for Myseq. e.g. empose "owl:alllValuesFrom" constraint on rfds:member. Finally found it is impossible in protege. (as far as I know now)

Protege list rdfs:member as the individule of rdf:Property in the "individuals tab", not as property in the "properties tab". Now I am curious about the reason. Might I send an email to their mailinglist? @_-?

2. A quick reference to OWL (Lite, DL, Full) construct.

Since it seems one can't use rdfs:member (or it's instance RDF:_#), I have to wondering whether it is a legal member of owl full or not. And the next question is, which rdf vocabularies are reversed in owl(ful, dl and lite).

ref:

  1. http://www.w3.org/TR/owl-ref/#Sublanguage-def
  2. http://www.w3.org/TR/owl-semantics/
    chapter4: http://www.w3.org/TR/owl-semantics/mapping.html

A brief summary:

  1. OWL Full contains all the OWL language constructs and provides free, unconstrained use of RDF constructs.
  2. OWL DL.
    uses all the OWL language constructs but with a number of constraints. Most RDF(S) vocabulary cannot be used within OWL DL. See the OWL Semantics and Abstract Syntax document [OWL S&AS] for details.
  3. OWL Lite. see here

msn就抽风吧

好不容易“小花”有渐好的迹象,统计数据又有了麻烦。
今天的统计数据根本显示不出来。
而且,同步发布也有问题。。。

6/01/2006

The world you don't know

try this:


很多事情,理论上知道跟亲身体验还真是两回事。

比如我们知道伊斯兰文都是从右向左写的。可从来没想过,他们的网页会是怎样。
上面的url是我从msn space的访问历史里面挖出来的一个。震惊啊震惊~
全部的右对齐。别扭的是是每行还是从左起。。。

很好奇他们是否国内的网站都是右对齐的……如果是的话,他们访问别的国家的网站岂不是很不习惯?

An ontology for e-learner - planning stage

predefined ontologies which might be useful

1. FOAF
2. event ontology from UMBC ebiquity group
3. Dublin Core

related work

1. Stojanovic, L., Staab, S and Studer, R. (2001) ELearning Based on the Semantic Web. Proceedings WebNet2001 - World Conference on the WWW and Internet, Orlando, Florida, USA, 2001.
2. Journal of Educational Technology & Society
Special Issue on "Ontologies and the Semantic Web for E-learning"