机器学习经典书籍&论文
《转》
论文学习
入门书单
《数学之美》PDF6
作者吴军大家都很熟悉。以极为通俗的语言讲述了数学在机器学习和自然语言处理等领域的应用。
《ProgrammingCollectiveIntelligence》(《集体智慧编程》)PDF3
作者TobySegaran也是《BeautifulData:TheStoriesBehindElegantDataSolutions》(《数据之美:解密优雅数据解决方案背后的故事》)的作者。这本书最大的优势就是里面没有理论推导和复杂的数学公式,是很不错的入门书。目前中文版已经脱销,对于有志于这个领域的人来说,英文的pdf是个不错的选择,因为后面有很多经典书的翻译都较差,只能看英文版,不如从这个入手。还有,这本书适合于快速看完,因为据评论,看完一些经典的带有数学推导的书后会发现这本书什么都没讲,只是举了很多例子而已。
《AlgorithmsoftheIntelligentWeb》(《智能web算法》)PDF1
作者HaralambosMarmanis、DmitryBabenko。这本书中的公式比《集体智慧编程》要略多一点,里面的例子多是互联网上的应用,看名字就知道。不足的地方在于里面的配套代码是BeanShell而不是python或其他。总起来说,这本书还是适合初学者,与上一本一样需要快速读完,如果读完上一本的话,这一本可以不必细看代码,了解算法主要思想就行了。
《统计学习方法》PDF模糊epub3
作者李航,是国内机器学习领域的几个大家之一,曾在MSRA任高级研究员,现在华为诺亚方舟实验室。书中写了十个算法,每个算法的介绍都很干脆,直接上公式,是彻头彻尾的“干货书”。每章末尾的参考文献也方便了想深入理解算法的童鞋直接查到经典论文;本书可以与上面两本书互为辅助阅读。
《MachineLearning》(《机器学习》)PDF7
作者TomMitchell是CMU的大师,有机器学习和半监督学习的网络课程视频。这本书是领域内翻译的较好的书籍,讲述的算法也比《统计学习方法》的范围要大很多。据评论这本书主要在于启发,讲述公式为什么成立而不是推导;不足的地方在于出版年限较早,时效性不如PRML。但有些基础的经典还是不会过时的,所以这本书现在几乎是机器学习的必读书目。
《MiningofMassiveDatasets》(《大数据》)PDF19
作者AnandRajaraman[3]、JeffreyDavidUllman,Anand是Stanford的PhD。这本书介绍了很多算法,也介绍了这些算法在数据规模比较大的时候的变形。但是限于篇幅,每种算法都没有展开讲的感觉,如果想深入了解需要查其他的资料,不过这样的话对算法进行了解也足够了。还有一点不足的地方就是本书原文和翻译都有许多错误,勘误表比较长,读者要用心了。
《DataMining:PracticalMachineLearningToolsandTechniques》(《数据挖掘:实用机器学习技术》)PDF16
作者IanH.Witten、EibeFrank是weka的作者、新西兰怀卡托大学教授。他们的《ManagingGigabytes》[4]也是信息检索方面的经典书籍。这本书最大的特点是对weka的使用进行了介绍,但是其理论部分太单薄,作为入门书籍还可,但是,经典的入门书籍如《集体智慧编程》、《智能web算法》已经很经典,学习的话不宜读太多的入门书籍,建议只看一些上述两本书没讲到的算法。
《机器学习及其应用》
周志华、杨强主编。来源于“机器学习及其应用研讨会”的文集。该研讨会由复旦大学智能信息处理实验室发起,目前已举办了十届,国内的大牛如李航、项亮、王海峰、刘铁岩、余凯等都曾在该会议上做过讲座。这本书讲了很多机器学习前沿的具体的应用,需要有基础的才能看懂。如果想了解机器学习研究趋势的可以浏览一下这本书。关注领域内的学术会议是发现研究趋势的方法嘛。
《ManagingGigabytes》(深入搜索引擎)PDF8
信息检索不错的书。
《ModernInformationRetrieval》PDF6
RicardoBaeza-Yatesetal.1999。貌似第一本完整讲述IR的书。可惜IR这些年进展迅猛,这本书略有些过时了。翻翻做参考还是不错的。另外,Ricardo同学现在是YahooResearchforEuropeandLatinAmeria的头头。
《推荐系统实践》PDF13
项亮,不错的入门读物
深入
《PatternClassification》(《模式分类》第二版)PDF14
作者RichardO.Duda[5]、PeterE.Hart、David。模式识别的奠基之作,但对最近呈主导地位的较好的方法SVM、Boosting方法没有介绍,被评“挂一漏万之嫌”。
《PatternRecognitionAndMachineLearning》PDF74
作者ChristopherM.Bishop[6];简称PRML,侧重于概率模型,是贝叶斯方法的扛鼎之作,据评“具有强烈的工程气息,可以配合stanford大学AndrewNg教授的MachineLearning视频教程一起来学,效果翻倍。”
《TheElementsofStatisticalLearning:DataMining,Inference,andPrediction》,(《统计学习基础:数据挖掘、推理与预测》第二版)PDF8
作者RobertTibshirani、TrevorHastie、JeromeFriedman。“这本书的作者是Boosting方法最活跃的几个研究人员,发明的GradientBoosting提出了理解Boosting方法的新角度,极大扩展了Boosting方法的应用范围。这本书对当前最为流行的方法有比较全面深入的介绍,对工程人员参考价值也许要更大一点。另一方面,它不仅总结了已经成熟了的一些技术,而且对尚在发展中的一些议题也有简明扼要的论述。让读者充分体会到机器学习是一个仍然非常活跃的研究领域,应该会让学术研究人员也有常读常新的感受。”[7]
《DataMining:ConceptsandTechniques》(《数据挖掘:概念与技术》第三版)PDF3
作者(美)JiaweiHan[8]、(加)MichelineKamber、(加)JianPei,其中第一作者是华裔。本书毫无疑问是数据挖掘方面的的经典之作,不过翻译版总是被喷,没办法,大部分翻译过来的书籍都被喷,想要不吃别人嚼过的东西,就好好学习英文吧。
《AI,ModernApproach2nd》PDF8
PeterNorvig,无争议的领域经典。
《FoundationsofStatisticalNaturalLanguageProcessing》PDF7
自然语言处理领域公认经典。
《InformationTheory:InferenceandLearningAlgorithms》PDF5
《StatisticalLearningTheory》PDF7
Vapnik的大作,统计学界的权威,本书将理论上升到了哲学层面,他的另一本书《TheNatureofStatisticalLearningTheory》也是统计学习研究不可多得的好书,但是这两本书都比较深入,适合有一定基础的读者。
数学基础
《矩阵分析》PDF22
RogerHorn。矩阵分析领域无争议的经典
《概率论及其应用》PDF3
威廉·费勒。极牛的书,可数学味道太重,不适合做机器学习的
《AllOfStatistics》PDF扫描版10PDF
高清版18
机器学习这个方向,统计学也一样非常重要。推荐Allofstatistics,这是CMU的一本很简洁的教科书,注重概念,简化计算,简化与MachineLearning无关的概念和统计内容,可以说是很好的快速入门材料。
《NonlinearProgramming,2nd》PDF5
最优化方法,非线性规划的参考书。
《ConvexOptimization》PDF9配套代码7
Boyd的经典书籍,被引用次数超过14000次,面向实际应用,并且有配套代码,是一本不可多得的好书。
《NumericalOptimization》PDF6
第二版,Nocedal著,非常适合非数值专业的学生和工程师参考,算法流程清晰详细,原理清楚。
《IntroductiontoMathematicalStatistics》PDF5
第六版,Hogg著,本书介绍了概率统计的基本概念以及各种分布,以及ML,Bayesian方法等内容。
《AnIntroductiontoProbabilisticGraphicalModels》PDF20
Jordan著,本书介绍了条件独立、分解、混合、条件混合等图模型中的基本概念,对隐变量(潜在变量)也做了详细介绍,相信大家在隐马尔科夫链和用Gaussian混合模型来实现EM算法时遇到过这个概念。
《ProbabilisticGraphicalModels-PrinciplesandTechniques》PDF8
Koller著,一本很厚很全面的书,理论性很强,可以作为参考书使用。
具体数学PDF5
经典
大家的补充
线性代数(LinearAlgebra):
我想国内的大学生都会学过这门课程,但是,未必每一位老师都能贯彻它的精要。这门学科对于Learning是必备的基础,对它的透彻掌握是必不可少的。我在科大一年级的时候就学习了这门课,后来到了香港后,又重新把线性代数读了一遍,所读的是
IntroductiontoLinearAlgebra(3rdEd.)byGilbertStrang.
这本书是MIT的线性代数课使用的教材,也是被很多其它大学选用的经典教材。它的难度适中,讲解清晰,重要的是对许多核心的概念讨论得比较透彻。我个人觉得,学习线性代数,最重要的不是去熟练矩阵运算和解方程的方法——这些在实际工作中MATLAB可以代劳,关键的是要深入理解几个基础而又重要的概念:子空间(Subspace),正交(Orthogonality),特征值和特征向量(Eigenvaluesandeigenvectors),和线性变换(Lineartransform)。从我的角度看来,一本线代教科书的质量,就在于它能否给这些根本概念以足够的重视,能否把它们的联系讲清楚。Strang的这本书在这方面是做得很好的。
而且,这本书有个得天独厚的优势。书的作者长期在MIT讲授线性代数课(18.06),课程的video在MIT的Opencourseware网站上有提供。有时间的朋友可以一边看着名师授课的录像,一边对照课本学习或者复习。
http://ocw.mit.edu/OcwWeb/Mathematics/18-06Spring-2005/CourseHome/index.htm8
概率和统计(ProbabilityandStatistics):
概率论和统计的入门教科书很多,我目前也没有特别的推荐。我在这里想介绍的是一本关于多元统计的基础教科书:
AppliedMultivariateStatisticalAnalysis(5thEd.)byRichardA.JohnsonandDeanW.Wichern
这本书是我在刚接触向量统计的时候用于学习的,我在香港时做研究的基础就是从此打下了。实验室的一些同学也借用这本书学习向量统计。这本书没有特别追求数学上的深度,而是以通俗易懂的方式讲述主要的基本概念,读起来很舒服,内容也很实用。对于Linearregression,factoranalysis,principalcomponentanalysis(PCA),andcanonicalcomponentanalysis(CCA)这些Learning中的基本方法也展开了初步的论述。
之后就可以进一步深入学习贝叶斯统计和Graphicalmodels。一本理想的书是
IntroductiontoGraphicalModels(draftversion).byM.JordanandC.Bishop.
我不知道这本书是不是已经出版了(不要和LearninginGraphicalModels混淆,那是个论文集,不适合初学)。这本书从基本的贝叶斯统计模型出发一直深入到复杂的统计网络的估计和推断,深入浅出,statisticallearning的许多重要方面都在此书有清楚论述和详细讲解。MIT内部可以access,至于外面,好像也是有电子版的。
分析(Analysis):
我想大家基本都在大学就学过微积分或者数学分析,深度和广度则随各个学校而异了。这个领域是很多学科的基础,值得推荐的教科书莫过于
PrinciplesofMathematicalAnalysis,byWalterRudin
有点老,但是绝对经典,深入透彻。缺点就是比较艰深——这是Rudin的书的一贯风格,适合于有一定基础后回头去看。
在分析这个方向,接下来就是泛函分析(FunctionalAnalysis)。
IntroductoryFunctionalAnalysiswithApplications,byErwinKreyszig.
适合作为泛函的基础教材,容易切入而不失全面。我特别喜欢它对于谱论和算子理论的特别关注,这对于做learning的研究是特别重要的。Rudin也有一本关于functionalanalysis的书,那本书在数学上可能更为深刻,但是不易于上手,所讲内容和learning的切合度不如此书。
在分析这个方向,还有一个重要的学科是测度理论(Measuretheory),但是我看过的书里面目前还没有感觉有特别值得介绍的。
拓扑(Topology):
在我读过的基本拓扑书各有特色,但是综合而言,我最推崇:
Topology(2ndEd.)byJamesMunkres
这本书是Munkres教授长期执教MIT拓扑课的心血所凝。对于一般拓扑学(Generaltopology)有全面介绍,而对于代数拓扑(Algebraictopology)也有适度的探讨。此书不需要特别的数学知识就可以开始学习,由浅入深,从最基本的集合论概念(很多书不屑讲这个)到Nagata-SmirnovTheorem和Tychonofftheorem等较深的定理(很多书避开了这个)都覆盖了。讲述方式思想性很强,对于很多定理,除了给出证明过程和引导你思考其背后的原理脉络,很多令人赞叹的亮点——我常读得忘却饥饿,不愿释手。很多习题很有水平。
流形理论(Manifoldtheory):
对于拓扑和分析有一定把握时,方可开始学习流形理论,否则所学只能流于浮浅。我所使用的书是
IntroductiontoSmoothManifolds.byJohnM.Lee
虽然书名有introduction这个单词,但是实际上此书涉入很深,除了讲授了基本的manifold,tangentspace,bundle,sub-manifold等,还探讨了诸如纲理论(Categorytheory),德拉姆上同调(DeRhamcohomology)和积分流形等一些比较高级的专题。对于李群和李代数也有相当多的讨论。行文通俗而又不失严谨,不过对某些记号方式需要熟悉一下。
虽然李群论是建基于平滑流形的概念之上,不过,也可能从矩阵出发直接学习李群和李代数——这种方法对于急需使用李群论解决问题的朋友可能更加实用。而且,对于一个问题从不同角度看待也利于加深理解。下面一本书就是这个方向的典范:
LieGroups,LieAlgebras,andRepresentations:AnElementaryIntroduction.byBrianC.Hall
此书从开始即从矩阵切入,从代数而非几何角度引入矩阵李群的概念。并通过定义运算的方式建立exponentialmapping,并就此引入李代数。这种方式比起传统的通过“左不变向量场(Left-invariantvectorfield)“的方式定义李代数更容易为人所接受,也更容易揭示李代数的意义。最后,也有专门的论述把这种新的定义方式和传统方式联系起来。
机器学习经典书籍&论文
转自水木
除了以下推荐的书以外,出版在FoundationsandTrendsinMachineLearning上面的survey文章都值得一看。
入门:
PatternRecognitionAndMachineLearning
ChristopherM.Bishop
MachineLearning:AProbabilisticPerspective
KevinP.Murphy
TheElementsofStatisticalLearning:DataMining,Inference,andPredictio
n
TrevorHastie,RobertTibshirani,JeromeFriedman
InformationTheory,InferenceandLearningAlgorithms
DavidJ.C.MacKay
AllofStatistics:AConciseCourseinStatisticalInference
LarryWasserman
优化:
ConvexOptimization
StephenBoyd,LievenVandenberghe
NumericalOptimization
JorgeNocedal,StephenWright
OptimizationforMachineLearning
SuvritSra,SebastianNowozin,StephenJ.Wright
核方法:
KernelMethodsforPatternAnalysis
JohnShawe-Taylor,NelloCristianini
LearningwithKernels:SupportVectorMachines,Regularization,Optimizatio
n,andBeyond
BernhardSchlkopf,AlexanderJ.Smola
半监督:
Semi-SupervisedLearning
OlivierChapelle
高斯过程:
GaussianProcessesforMachineLearning(AdaptiveComputationandMachineLe
arning)
CarlEdwardRasmussen,ChristopherK.I.Williams
概率图模型:
GraphicalModels,ExponentialFamilies,andVariationalInference
MartinJWainwright,MichaelIJordan
Boosting:
Boosting:FoundationsandAlgorithms
Schapire,RobertE.;Freund,Yoav
贝叶斯:
StatisticalDecisionTheoryandBayesianAnalysis
JamesO.Berger
TheBayesianChoice:FromDecision-TheoreticFoundationstoComputationalI
mplementation
ChristianP.Robert
BayesianNonparametrics
NilsLidHjort,ChrisHolmes,PeterMüller,StephenG.Walker
PrinciplesofUncertainty
JosephB.Kadane
DecisionTheory:PrinciplesandApproaches
GiovanniParmigiani,LurdesInoue
蒙特卡洛:
MonteCarloStrategiesinScientificComputing
JunS.Liu
MonteCarloStatisticalMethods
ChristianP.Robert,GeorgeCasella
信息几何:
MethodsofInformationGeometry
Shun-IchiAmari,HiroshiNagaoka
AlgebraicGeometryandStatisticalLearningTheory
Watanabe,Sumio
DifferentialGeometryandStatistics
M.K.Murray,J.W.Rice
渐进收敛:
AsymptoticStatistics
A.W.vanderVaart
EmpiricalProcessesinM-estimation
Geer,SaraA.vande
不推荐:
StatisticalLearningTheory
VladimirN.Vapnik
BayesianDataAnalysis,SecondEdition
AndrewGelman,JohnB.Carlin,HalS.Stern,DonaldB.Rubin
ProbabilisticGraphicalModels:PrinciplesandTechniques
DaphneKoller,NirFriedman
机器学习经典论文/survey合集
ActiveLearning
TwoFacesofActiveLearning50,Dasgupta,2011
ActiveLearningLiteratureSurvey8,Settles,2010
Applications
ASurveyofEmergingApproachestoSpamFiltering9,Caruana,2012
AmbientIntelligence:ASurvey3,Sadri,2011
ASurveyofOnlineFailurePredictionMethods2,Salfner,2010
AnomalyDetection:ASurvey3,Chandola,2009
MiningDataStreams:AReview4,Gaber,2005
WorkflowMining:ASurveyofIssuesandApproaches2,Aalst,2003
Biology
SupportVectorMachinesinBioinformatics:aSurvey12,Chicco,2012
ComputationalEpigenetics:TheNewScientificParadigm3,Lim,2010
AutomatedProteinStructureClassification:ASurvey4,Hassanzadeh,2009
Chemoinformatics-AnIntroductionforComputerScientists3,Brown,2009
ComputationalChallengesinSystemsBiology2,Heath,2009
ComputationalEpigenetics3,Bock,2008
ProgressandChallengesinProteinStructurePrediction3,Zhang,2008
AReviewofFeatureSelectioninBioinformatics4,Saeys,2007
MachineLearninginBioinformatics:ABriefSurveyandRecommendationsforPractitioners6,Bhaskar,2006
Bioinformatics-AnIntroductionforComputerScientists1,Cohen,2004
ComputationalSystemsBiology2,Kitano,2002
ProteinStructurePredictionandStructuralGenomics2,Baker,2001
RecentDevelopmentsandFutureDirectionsinComputationalGenomics1,Tsoka,2000
MolecularBiologyforComputerScientists1,Hunter,1993
Classification
SupervisedMachineLearning:AReviewofClassificationTechniques22,Kotsiantis,2007
Clustering
XMLDataClustering:AnOverview4,Algergawy,2011
DataClustering:50YearsBeyondK-Means6,Jain,2010
ClusteringStability:AnOverview5,Luxburg,2010
ParallelClusteringAlgorithms:ASurvey4,Kim,2009
ASurvey:ClusteringEnsemblesTechniques2,Ghaemi,2009
ATutorialonSpectralClustering4,Luxburg,2007
SurveyofClusteringDataMiningTechniques4,Berkhin,2006
SurveyofClusteringAlgorithms4,Xu,2005
ClusteringofTimeSeriesData-ASurvey3,Liao,2005
ClusteringMethods4,Rokach,2005
RecentAdvancesinClustering:ABriefSurvey2,Kotsiantis,2004
SubspaceClusteringforHighDimensionalData:AReview2,Parsons,2004
UnsupervisedandSemi-supervisedClustering:aBriefSurvey3,Grira,2004
ClusteringinLifeSciences3,Zhao,2002
OnClusteringValidationTechniques2,Halkidi,2001
DataClustering:AReview3,Jain,1999
ASurveyofFuzzyClustering4,Yang,1993
ComputerVision
PedestrianDetection:AnEvaluationoftheStateoftheArt7,Dollar,2012
AComparativeStudyofPalmprintRecognitionAlgorithms3,Zhang,2012
HumanActivityAnalysis:AReview2,Aggarwal,2011
SubspaceMethodsforFaceRecognition2,Rao,2010
ContextBasedObjectCategorization:ACriticalSurvey2,Galleguillos,2010
Objecttracking:ASurvey3,Yilmaz,2006
DetectingFacesinImages:ASurvey2,Yang,2002
Databases
DataFusion3,Bleiholder,2008
DuplicateRecordDetection:ASurvey2,Elmagarmid,2007
OverviewofRecordLinkageandCurrentResearchDirections2,Winkler,2006
ASurveyofSchema-basedMatchingApproaches3,Shvaiko,2005
DeepLearning
RepresentationLearning:AReviewandNewPerspectives17,Bengio,2012
DimensionReduction
DimensionalityReduction:AComparativeReview6,Maaten,2009
DimensionReduction:AGuidedTour4,Burges,2009
ASurveyofManifold-BasedLearningMethods2,Huo,2007
TowardIntegratingFeatureSelectionAlgorithmsforClassificationandClustering3,Liu,2005
AnIntroductiontoVariableandFeatureSelection3,Guyon,2003
ASurveyofDimensionReductionTechniques2,Fodor,2002
Economics
AuctionsandBidding:AGuideforComputerScientists1,Parsons,2011
ComputationalSustainability1,Gomes,2009
ComputationalFinance1,Tsang,2004
GameTheory
ComputerPoker:AReview4,Rubin,2011
GraphicalModels
AnIntroductiontoVariationalMethodsforGraphicalModels5,Jordan,1999
KernelMethods
KernelsforVector-ValuedFunctions:aReview4,Alvarez,2012
LearningTheory
IntroductiontoStatisticalLearningTheory7,Bousquet,2004
MachineLearning
AFewUsefulThingstoKnowaboutMachineLearning7,Domingos,2012
ATutorialonBayesianNonparametricModels4,Blei,2011
DecisionForestsforClassification,Regression,DensityEstimation,ManifoldLearningandSemi-SupervisedLearning2,Criminisi,2011
Top10AlgorithmsinDataMining4,Wu,2008
Semi-SupervisedLearningLiteratureSurvey,Zhu,2007
InterestingnessMeasuresforDataMining:ASurvey,Geng,2006
ASurveyofInterestingnessMeasuresforKnowledgeDiscovery1,McGarry,2005
ATutorialontheCross-EntropyMethod,Boer,2005
ASurveyofKernelsforStructuredData,Gartner,2003
SurveyonFrequentPatternMining,Goethals,2003
TheBoostingApproachtoMachineLearning:AnOverview1,Schapire,2003
ASurveyonWaveletApplicationsinDataMining,Li,2002
Mathematics
TopologyandData3,Carlsson,2009
Multi-armedBandit
RegretAnalysisofStochasticandNonstochasticMulti-armedBanditProblems3,Bubeck,2012
NaturalComputing
ReservoirComputingApproachestoRecurrentNeuralNetworkTraining,Jaeger,2009
ArtificialImmuneSystems,Aickelin,2005
ASurveyofEvolutionaryAlgorithmsforDataMiningandKnowledgeDiscovery,Freitas??,2003
DataMininginSoftComputingFramework:ASurvey,Mitra,2002
NeuralNetworksforClassification:ASurvey1,Zhang,2000
NaturalLanguageProcessing
ProbabilisticTopicModels2,Blei,2012
OntologyLearningFromText:ALookBackAndIntoTheFuture1,Wong,2012
MachineTransliterationSurvey,Karimi,2011
TranslationTechniquesinCross-LanguageInformationRetrieval,Zhou,2011
ComprehensiveReviewofOpinionSummarization,Kim,2011
ASurveyonSentimentDetectionofReviews,Tang,2009
WordSenseDesambiguation:ASurvey,Navigli,2009
TopicModels,Blei,2009
OpinionMiningandSentimentAnalysis,Pang,2008
InformationExtraction,Sarawagi,2008
StatisticalMachineTranslation,Lopez,2008
ASurveyofNamedEntityRecognitionandClassification,Nadeau,2007
AdaptiveInformationExtraction,Turmo,2006
SurveyofTextClustering,Jing,2005
MachineLearninginAutomatedTextCategorization,Sebastiani,2002
WebMiningResearch:ASurvey,Kosala,2000
Networks
CommunityDetectioninGraphs1,Fortunato,2010
ASurveyofStatisticalNetworkModels,Goldenberg,2010
CommunitiesinNetworks,Porter,2009
GraphClustering,Schaeffer,2007
GraphMining:Laws,Generators,andAlgorithms,Chakrabarti,2006
ComparingCommunityStructureIdentification,Danon,2005
LinkMining:ASurvey1,Getoor,2005
DetectingCommunityStructureinNetworks,Newman,2004
LinkMining:ANewDataMiningChallenge,Getoor,2003
On-LineLearning
On-LineAlgorithmsinMachineLearning1,Blum,1998
Others
ASurveyofVeryLarge-ScaleNeighborhoodSearchTechniques,Ahuja,2001
PlanningandScheduling
AReviewofMachineLearningforAutomatedPlanning1,Jimenez,2009
Probabilistic
ApproximatePolicyIteration:ASurveyandSomeNewMethods,Bertsekas,2011
AnIntroductiontoMCMCforMachineLearning1,Andrieu,2003
ProbabilisticModels
AnIntroductiontoConditionalRandomFields1,Sutton,2010
RandomizedAlgorithms
RandomizedAlgorithmsforMatricesandData1,Mahoney,2011
RecommenderSystems
RecentadvancesinPersonalizedRecommenderSystems1,Liu,2009
MatrixFactorizationTechniquesforRecommenderSystems1,Koren,2009
ASurveyofCollaborativeFilteringTechniques1,Su,2009
Regression
EnsembleApproachesforRegression:aSurvey4,Moreira,2012
ReinforcementLearning
ASurveyofReinforcementLearninginRelationalDomains1,Otterlo,2005
ReinforcementLearning:ASurvey,Kaelbling,1996
RuleLearning
AssociationMining,Ceglar,2006
AlgorithmsforAssociationRuleMining-AGeneralSurveyandComparison,Hipp,2000
Testing
ControlledExperimentsontheWeb:SurveyandPracticalGuide,Kohavi,2009
TimeSeries
Time-SeriesDataMining2,Esling,2012
AReviewonTimeSeriesDataMining1,Fu,2011
DiscreteWaveletTransform-BasedTimeSeriesAnalysisandMining,Chaovalit,2011
TransferLearning
ASurveyonTransferLearning,Pan,2010
WebMining
ATaxonomyofSequentialPatternMiningAlgorithms,Mabroukeh,2010
ASurveyofWebClusteringEngines,Carpineto,2009
WebPageClassification:FeaturesandAlgorithms,Qi,2009
MiningInterestingKnowledgefromWeblogs:ASurvey,Facca,2005
AnOverviewofWebDataClusteringPractices,Vakali,2005
ASurveyofWebMetrics,Dhyani,2002
DataMiningforHypertext:ATutorialSurvey3,Chakrabarti,2000