0%

在R语言中,CRAN有几个包可以让R和DBMSs进行通信。 CRAN上的RMySQL包提供了和MySQL数据库系统的接口。RMySQL依赖于DBI包。 MySQL是一个轻量级的数据库系统,而RMySQL包在Linux和Windows下均可以使用。 在Windows环境下,通过菜单栏中的“程序包”-》“安装程序包”来找到DBI和RMySQL包,下载安装。 代码如下:

1
2
3
4
5
6
library(DBI) #由于RMySQL依赖于DBI包,所以先加载DBI
library(RMySQL)
con<-dbConnect(dbDriver("MySQL"),dbname="dbname",user="username",password="password")
#数据库驱动,数据库名称,数据库用户名和密码
dbListTables(con)#列出数据库中的表
dbGetQuery(con,paste("select * from table-name","where ..."))#执行一条查询语句
Read more »

在Ubuntu10.10中使用MySql数据库,创建完表之后想要从本地文件中导入数据,使用下面的语句: load data infile ‘file path’ into table table_name; 该语句在windows系统中运行正常,但在Ubuntu中提示下列错误 Error Code: 13

Can’t get stat of  ‘ file path’

即无法找到本地文件。从网上查了一下,sql语句需要改为

load data local file

即缺了一个local

另外,在Ubuntu中想要读取本地文件,还需要有足够的权限。可以用chmod命令改变文件的权限。

Read more »

训练集(Training Set) 和 测试集(Test Set) 被广泛应用在人工智能、机器学习、遗传编程、智能系统、统计学等领域中。 训练集用来构建或者发现潜在的预测关系。 通过训练集来构建的数据关系,都存在某种程度的过适(过拟合,over-fit)问题。也就是说,训练集训练出来的模型只能体现训练集中数据之间显然的关系,却未必能代表所有的数据。 而测试集则是独立于训练集的一组数据,但它服从和训练集同样的概率分布。 如果一个模型既能能很好的拟合训练集也能很好的拟合测试集,则过拟合现象就不明显。 如果模型只能拟合训练集而不能很好的拟合测试集,则过拟合现象就发生了。 简言之,训练集用来训练一个模型,测试集用来测试该模型是否恰当。 如图所示,左图的蓝点表示训练集中的数据,而绿色和橘色的曲线则是对测试集的拟合。 [caption id=”” align=”aligncenter” width=”1400”]Trainig set and test set Trainig set and test set[/caption]

右图的蓝点表示测试集中的数据。训练集中橘色曲线拟合的MSE为4,绿色曲线为9。

同样的曲线,在测试集当中,橘色曲线的MSE为15,绿色曲线为13。

Read more »

  1. 陈朗
    那个时候她精神空虚,睡觉的时候想吃饭,吃饭的时候想睡觉,读书的时候想做爱,做爱的时候想读书,并且想发明一种大号的指甲剪,把他们系主任徐老师的头剪下来。

  2. 杨小蕾
    小蕾喜欢笑。她对所有的情绪——尴尬、失落、茫然、紧张、恐惧、甚至悲伤——都用一种表情来表达,就是:笑。好像她整个的生活就是一个疯子驾驶着的汽车,而笑则是一次一次的紧急刹车。

  3. 她们仨
    陈朗、杨如意、郭小蕾三个女孩围着一盘清清爽爽的土豆丝,陶醉地吃着,她们分别已经27岁,28岁和25岁。分别穿着红色、黑色和白色的裙子。她们最喜欢的食物分别是西瓜、西瓜和西瓜,而她们最讨厌的动物分别是蟑螂、蟑螂和蟑螂。她们有过的男朋友分别是3个、2个和0个。她们平均每哭一场的间隔分别是3天、5天和4天,但平均一天微笑的次数是29次、15次和138次。她们的政治立场分别是“自由主义”、“什么他妈的政治观”和“我希望熊猫永远不灭绝”。她们理想分别是“一个悄悄在夜总会唱歌的著名学者”、“Max Studio总裁的情妇”和“12个孩子的奶奶——这12个孩子的头发要有各种颜色”。

  4. 陈朗与周禾
      坐在咖啡馆里戴墨镜的陈朗。周禾看着她,心里有一股柔情。
    “你吃不吃什么?”
    “不吃。你老问我想吃什么干嘛?”
    “把你吃胖了,你就嫁不出去了。”
    “我嫁不出去对你有什么好处?”
    “嫁不出去就嫁给我呀。”
    这样的对话陈朗和周禾已经进行了无数遍。单纯、愚蠢,结尾的一句总是“嫁不出去就嫁给我呀”。陈朗每次听到这句话都很欢喜——满足了她那点简单的虚荣心。

  5. 杨小蕾
    小蕾觉得自己的生活就像一个迷宫,一转身就是一堵墙,一转身又是一堵墙。英俊是一堵墙,丑陋也是一堵墙。有钱是一堵墙,穷也是一堵墙。聪明是一堵墙,笨也是一堵墙。有学位是一堵墙,没学位也是一堵墙。语言是一道墙。种族是一道墙。国籍是一道墙。历史是一道墙。

  6. Adam
    他觉得他得了一种病,也许可以叫“爱情阳痿症”。他就是没法疯狂地爱上一个人,虽然在过去15年里他有过至少30个女朋友。白的、黑的、黄的。胖的、瘦的、不胖不瘦的。放荡的、温柔的、放荡而温柔的。才华横溢的、愚不可及的、愚不可及地才华横溢的。总而言之,他多年来的恋情,纵跨老中青三代,横跨亚非拉三洲。但是没有用,他越来越感觉不到心动。

  7. 一平
    他喜欢逗如意,看她一本正经给他讲解的样子,要是他接着装傻,就还能看到她气急败坏的样子,那就更可爱了。他喜欢调试如意的情绪,因为她的喜怒哀乐总是那么一览无余,好像她脸上有一个情绪的键盘,上面写着“高兴”、“气愤”、“兴奋”、“恼怒”……你只要朝着你想要的娱乐频道,啪地一按,那种情绪就会喷涌而出。

  8. 她们仨
    她们做女人也算是鞠躬尽瘁、老而后已了,该冒傻气的时候冒傻气,该露乳沟的时候露乳沟,该笑的时候笑,该哭的时候哭。优雅、骄傲、娇憨、贤惠、活泼……各种凶器,信手拈来,无所不用其极。
    但是她们找不到爱情。青春的汽笛已经拉响,手上的另一张车票还是无人认领。

  9. 李一平
    那被长期镇压的脆弱、无助、孤独,突然揭竿而起,从潜意识的层面跳到意识的层面上来。这些情绪总是被他压抑着,平时是一群无家可归的孩子,在这个空空荡荡的房子里游荡。它们乔装打扮成神经兮兮的唱歌、笑、哭,和品种繁多的so what,唧唧喳喳地围绕着一平。但是这一刻,它们突然结束了流浪,集合在一平面前,像一支起义的部队。其声势之浩大,把一平给镇住了。

  10. 陈朗与周禾
    比如说,你每次给我买东西,我都要了,你每次给我打电话我都接了,你每次帮我拎东西的时候,我都没有拒绝,这还不够好吗?再比如说了,我还给你写过诗呢

  11. Adam
    他的生活丰富多彩,健康向上。工作日的时候去华尔街实习,周末的时候号召朋友们去野外郊游,16岁的时候交第一个女朋友,18岁的时候上常青藤大学,22岁的时候就去了摩根斯坦利。他吃健康食品,读纽约时报,大脑和身上的肌肉一样发达。进出门的时候跟楼下的黑人门卫说“你好”,听音乐会的时候,总是最后一个停止鼓掌的人。他听别人说话的时候,直视别人的眼睛,课堂讨论冷场的时候,总是义不容辞顶上去。总而言之,too good to be true。但是,就是这样一个造物的恩宠,被制造出来的时候还是有一个设计错误,就是:他的心“阳痿”了,看到女人,没有动静。

  12. 周禾
    来到美国的中国人,大多变得抠抠缩缩、小里小气,而周禾是极少见的几个保留了“哥们”这个概念的人。他心胸宽广,有情有义,仁、义、礼、智、信……简直可以说集中体现了“三个代表”的精神。

  13. 杨如意
    如意最擅长的就是卤牛肉。多年以后,她所有的朋友想起她的时候,记忆里都会弥漫着一股卤牛肉的香气。

  14. 李一平
    一平在洗澡。他边洗澡边唱着革命歌曲。“一送里个红军,该子个下了山,秋雨里个绵绵,该子个秋风寒……”他心情不错,唱的声音也特别大。但是今天,不知道为什么,在唱了这支歌起码一百遍之后,他突然意识到,这其实是一首伤感的歌。抛除这首的革命性不说,就这首歌本身而言,就是一首伤感的歌。一群人送走一群人,流浪开始了,秋风秋雨的,从此天各一方,这难道不是一件伤感的事?事物的发生总是有一个程序,革命也是这样,从悲壮到滑稽,到无聊,到遗忘,最后,只剩下无名的伤感。

Read more »

by Lea Barton June 28,2007(翻译自本链接)

GRE AW是我的专长。写一篇完美的GRE AW不是件容易的事,事实上挺难的,只有4%的GRE考生能写出这样的文章。在本文中,我将一步步地说明我是怎样在GRE AW中取得完美的分数的。照这样做你也能写出好文章。

第一步:仔细阅读题目,至少读上三遍,把题理解透。GRE的AW由两部分构成,在第一部分中你可以在两篇(issue)中选一篇写,第二部分(argument)你就没得选了。不管写哪一部分,都要仔细读题。

第二步:写正确,审慎,完整的主题陈述(thesis statement)。还记得初中时候写的那些么?跟那差不多,别发挥创造力或者用什么华丽辞藻,也别太掉书袋。直奔主题就是了。如果问题是关于1700年代法国民族主义的变化和延续性的,要保证你的主题陈述写成这样子:”In the 1700s in France, nationalism caused changes such as [插入变化的例子], while many continuities such as [插入延续性的例子] balanced the system on the whole, setting the stage for future revolution.”把主题陈述放在文章开头第一段,点出”changes“和”continuity“——最重要的是每个方面都附带一两个例子——所有这些都写在一个句子中,然后围绕这个主题展开。

第三步:找出你文章的观点,一个个阐述,每一个观点一段。找到(上例中)每一个”change“,解释它,并用具体的例子来支撑它,提及某一事件,某个作者等等。在写”continuity“的时候也一样。不管是谁批阅你的文章,他们都在找这些点。别太含糊和笼统,尽一切可能的具体化(specific)。要保证你的文章中有至少4个具体的例子。

第四步:不仅要叙述还要分析。在文章当中讲个故事挺容易,但这是分析性写作(analytical Writing),所以你还得分析。针对你提供的信息进行分析,一步步来。要保证文章中有至少2到3句具体的高度分析性的句子。

第五步:把你的文章和其它不同的领域联系起来。如果文章是关于法国历史的,你可以讨论一下法国的民族主义对美国或欧洲其它地区的影响。如果你的文章是关于美国K-12免费教育问题的,联系一下更高年级的教育问题。

第六步:在最后一段当中用一种全新的方式重新陈述一下主题。这样你就能重新点题,有画龙点睛之效。

就是这样!我用这种方法在去年冬天的GRE考试的写作部分取得完美的成绩。要是这招考数学的时候也管用就好了!祝你好运!

Read more »

本文翻译自《Linear Algebra and Its Applications》的作者 David C.Lay 的网站上的一篇文章(pdf)How to learn linear algebra.

国内机械工业出版社出版了本书中文版《线性代数及其应用》。实在是难得的好书。

红色部分为重点,普遍适用于一般的线性代数学习。其余部分和该书配套的 Study Guide有关。

怎样学习线性代数


线性代数跟之前所有的数学课都非常不同。学习的重点从学习计算过程转移到消化并掌握这些计算的原理。要想坚持下去,你可能需要掌握某种学习数学的新方法。这就是我写作这本Study Guide的原因——教你怎样学好这门课,并介绍一些工具。

因为你可能会在以后的工作中用到线性代数,你需要把相关的知识学到某种水平,而不只是为了期末考试及格。我相信下面的一些策略对达到该目标是至关重要的。 

1. 在你开始做练习之前先认真学习。很多同学在线性代数之前的数学课上并不这么做。当他们做不出来的时候就去看前面的例题。这招在线性代数里可不管用。如果你照搬一个例题(有必要的修改),你以为你理解了题目,其实你没学到什么。(最终你会在考试的时候发现这个问题。)对这门课来说,除了要学会怎么进行某种运算外,你必须学会什么时候该使用这种运算,还有(更重要的是)为什么它管用。

     要做好家庭作业,先把课本这一节看一遍,也许要做一些笔记。然后阅读Study Guide里面本节的Key Ideas 或者Study Notes 。然后开始做作业。长远来看,这样做会让你做得更好还会节省你的时间。花在这方面的准备时间            会大大减少你用来准备考试的时间。

2. 像学某门语言一样为每一节课做准备。掌握这门课要求你掌握大量的词汇。现在你的目标成了熟悉这些概念,并在口头和书面中自如(而且正确)地运用。做作业的时候,试着写完整的句子,你会在Study Guide中发现解决方法。也要注意这里提到的术语的误用问题。

Read more »

做陈圣元GRE填空的时候,看到这样一道题:

In sharp contrast to the intense ___ of the young republic, with its Utopian faith in democracy and hopes for eternal human progress, rencent developments suggest a mood of almost unrelieved ___.

A. idealism .. cynicism
B. individualism .. escapism
C. sectarianism .. recklessness
D. assertiveness .. ambition
E. righteousness .. egalitarianism

作为天朝出来的,我知道答案为:A。

Read more »