数据挖掘方面重要会议的最佳paper集合-mysql教程-PHP中文网

首页

数据库

mysql教程

数据挖掘方面重要会议的最佳paper集合

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 03:56 PM

数据挖掘最佳集合

数据挖掘方面重要会议的最佳paper集合，后续将陆续分析一下内容：主要有KDD、SIGMOD、VLDB、ICML、SIGIR KDD (Data Mining) 2013 Simple and Deterministic Matrix Sketching Edo Liberty, Yahoo! Research 2012 Searching and Mining Trillions of Time Se

数据挖掘方面重要会议的最佳paper集合，后续将陆续分析一下内容：

主要有KDD、SIGMOD、VLDB、ICML、SIGIR

KDD (Data Mining)
2013	Simple and Deterministic Matrix Sketching	Edo Liberty, Yahoo! Research
2012	Searching and Mining Trillions of Time Series Subsequences under Dynamic Time Warping	Thanawin Rakthanmanon, University of California Riverside; et al.
2011	Leakage in Data Mining: Formulation, Detection, and Avoidance	Shachar Kaufman, Tel-Aviv University; et al.
2010	Large linear classification when data cannot fit in memory	Hsiang-Fu Yu, National Taiwan University; et al.
2010	Connecting the dots between news articles	Dafna Shahaf & Carlos Guestrin, Carnegie Mellon University
2009	Collaborative Filtering with Temporal Dynamics	Yehuda Koren, Yahoo! Research
2008	Fastanova: an efficient algorithm for genome-wide association study	Xiang Zhang, University of North Carolina at Chapel Hill; et al.
2007	Predictive discrete latent factor models for large scale dyadic data	Deepak Agarwal & Srujana Merugu, Yahoo! Research
2006	Training linear SVMs in linear time	Thorsten Joachims, Cornell University
2005	Graphs over time: densification laws, shrinking diameters and possible explanations	Jure Leskovec, Carnegie Mellon University; et al.
2004	A probabilistic framework for semi-supervised clustering	Sugato Basu, University of Texas at Austin; et al.
2003	Maximizing the spread of influence through a social network	David Kempe, Cornell University; et al.
2002	Pattern discovery in sequences under a Markov assumption	Darya Chudova & Padhraic Smyth, University of California Irvine
2001	Robust space transformations for distance-based operations	Edwin M. Knorr, University of British Columbia; et al.
2000	Hancock: a language for extracting signatures from data streams	Corinna Cortes, AT&T Laboratories; et al.
1999	MetaCost: a general method for making classifiers cost-sensitive	Pedro Domingos, Universidade Técnica de Lisboa
1998	Occam's Two Razors: The Sharp and the Blunt	Pedro Domingos, Universidade Técnica de Lisboa
1997	Analysis and Visualization of Classifier Performance: Comparison under Imprecise Class and Cost Di...	Foster Provost & Tom Fawcett, NYNEX Science and Technology

SIGMOD (Databases)
2013	Massive Graph Triangulation	Xiaocheng Hu, The Chinese University of Hong Kong; et al.
2012	High-Performance Complex Event Processing over XML Streams	Barzan Mozafari, Massachusetts Institute of Technology; et al.
2011	Entangled Queries: Enabling Declarative Data-Driven Coordination	Nitin Gupta, Cornell University; et al.
2010	FAST: fast architecture sensitive tree search on modern CPUs and GPUs	Changkyu Kim, Intel; et al.
2009	Generating example data for dataflow programs	Christopher Olston, Yahoo! Research; et al.
2008	Serializable isolation for snapshot databases	Michael J. Cahill, University of Sydney; et al.
2008	Scalable Network Distance Browsing in Spatial Databases	Hanan Samet, University of Maryland; et al.
2007	Compiling mappings to bridge applications and databases	Sergey Melnik, Microsoft Research; et al.
2007	Scalable Approximate Query Processing with the DBO Engine	Christopher Jermaine, University of Florida; et al.
2006	To search or to crawl?: towards a query optimizer for text-centric tasks	Panagiotis G. Ipeirotis, New York University; et al.
2004	Indexing spatio-temporal trajectories with Chebyshev polynomials	Yuhan Cai & Raymond T. Ng, University of British Columbia
2003	Spreadsheets in RDBMS for OLAP	Andrew Witkowski, Oracle; et al.
2001	Locally adaptive dimensionality reduction for indexing large time series databases	Eamonn Keogh, University of California Irvine; et al.
2000	XMill: an efficient compressor for XML data	Hartmut Liefke, University of Pennsylvania Dan Suciu, AT&T Laboratories
1999	DynaMat: a dynamic view management system for data warehouses	Yannis Kotidis & Nick Roussopoulos, University of Maryland
1998	Efficient transparent application recovery in client-server information systems	David Lomet & Gerhard Weikum, Microsoft Research
1998	Integrating association rule mining with relational database systems: alternatives and implications	Sunita Sarawagi, IBM Research; et al.
1997	Fast parallel similarity search in multimedia databases	Stefan Berchtold, University of Munich; et al.
1996	Implementing data cubes efficiently	Venky Harinarayan, Stanford University; et al.

VLDB (Databases)
2013	DisC Diversity: Result Diversification based on Dissimilarity and Coverage	Marina Drosou & Evaggelia Pitoura, University of Ioannina
2012	Dense Subgraph Maintenance under Streaming Edge Weight Updates for Real-time Story Identification	Albert Angel, University of Toronto; et al.
2011	RemusDB: Transparent High-Availability for Database Systems	Umar Farooq Minhas, University of Waterloo; et al.
2010	Towards Certain Fixes with Editing Rules and Master Data	Shuai Ma, University of Edinburgh; et al.
2009	A Unified Approach to Ranking in Probabilistic Databases	Jian Li, University of Maryland; et al.
2008	Finding Frequent Items in Data Streams	Graham Cormode & Marios Hadjieleftheriou, AT&T Laboratories
2008	Constrained Physical Design Tuning	Nicolas Bruno & Surajit Chaudhuri, Microsoft Research
2007	Scalable Semantic Web Data Management Using Vertical Partitioning	Daniel J. Abadi, Massachusetts Institute of Technology; et al.
2006	Trustworthy Keyword Search for Regulatory-Compliant Records Retention	Soumyadeb Mitra, University of Illinois at Urbana-Champaign; et al.
2005	Cache-conscious Frequent Pattern Mining on a Modern Processor	Amol Ghoting, Ohio State University; et al.
2004	Model-Driven Data Acquisition in Sensor Networks	Amol Deshpande, University of California Berkeley; et al.
2001	Weaving Relations for Cache Performance	Anastassia Ailamaki, Carnegie Mellon University; et al.
1997	Integrating Reliable Memory in Databases	Wee Teck Ng & Peter M. Chen, University of Michigan

ICML (Machine Learning)
2013	Vanishing Component Analysis	Roi Livni, The Hebrew University of Jerusalum; et al.
2013	Fast Semidifferential-based Submodular Function Optimization	Rishabh Iyer, University of Washington; et al.
2012	Bayesian Posterior Sampling via Stochastic Gradient Fisher Scoring	Sungjin Ahn, University of California Irvine; et al.
2011	Computational Rationalization: The Inverse Equilibrium Problem	Kevin Waugh, Carnegie Mellon University; et al.
2010	Hilbert Space Embeddings of Hidden Markov Models	Le Song, Carnegie Mellon University; et al.
2009	Structure preserving embedding	Blake Shaw & Tony Jebara, Columbia University
2008	SVM Optimization: Inverse Dependence on Training Set Size	Shai Shalev-Shwartz & Nathan Srebro, Toyota Technological Institute at Chicago
2007	Information-theoretic metric learning	Jason V. Davis, University of Texas at Austin; et al.
2006	Trading convexity for scalability	Ronan Collobert, NEC Labs America; et al.
2005	A support vector method for multivariate performance measures	Thorsten Joachims, Cornell University
1999	Least-Squares Temporal Difference Learning	Justin A. Boyan, NASA Ames Research Center

SIGIR (Information Retrieval)
2013	Beliefs and Biases in Web Search	Ryen W. White, Microsoft Research
2012	Time-Based Calibration of Effectiveness Measures	Mark Smucker & Charles Clarke, University of Waterloo
2011	Find It If You Can: A Game for Modeling Different Types of Web Search Success Using Interaction Data	Mikhail Ageev, Moscow State University; et al.
2010	Assessing the Scenic Route: Measuring the Value of Search Trails in Web Logs	Ryen W. White, Microsoft Research Jeff Huang, University of Washington
2009	Sources of evidence for vertical selection	Jaime Arguello, Carnegie Mellon University; et al.
2008	Algorithmic Mediation for Collaborative Exploratory Search	Jeremy Pickens, FX Palo Alto Lab; et al.
2007	Studying the Use of Popular Destinations to Enhance Web Search Interaction	Ryen W. White, Microsoft Research; et al.
2006	Minimal Test Collections for Retrieval Evaluation	Ben Carterette, University of Massachusetts Amherst; et al.
2005	Learning to estimate query difficulty: including applications to missing content detection and dis...	Elad Yom-Tov, IBM Research; et al.
2004	A Formal Study of Information Retrieval Heuristics	Hui Fang, University of Illinois at Urbana-Champaign; et al.
2003	Re-examining the potential effectiveness of interactive query expansion	Ian Ruthven, University of Strathclyde
2002	Novelty and redundancy detection in adaptive filtering	Yi Zhang, Carnegie Mellon University; et al.
2001	Temporal summaries of new topics	James Allan, University of Massachusetts Amherst; et al.
2000	IR evaluation methods for retrieving highly relevant documents	Kalervo J?rvelin & Jaana Kek?l?inen, University of Tampere
1999	Cross-language information retrieval based on parallel texts and automatic mining of parallel text...	Jian-Yun Nie, Université de Montréal; et al.
1998	A theory of term weighting based on exploratory data analysis	Warren R. Greiff, University of Massachusetts Amherst
1997	Feature selection, perceptron learning, and a usability case study for text categorization	Hwee Tou Ng, DSO National Laboratories; et al.
1996	Retrieving spoken documents by combining multiple index sources	Gareth Jones, University of Cambridge; et al.

推荐一个网站，感谢作者的努力搜集，主要是各种顶级会议的最佳论文集合。

http://jeffhuang.com/best_paper_awards.html

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

解释酸的特性（原子，一致性，隔离，耐用性）。Apr 16, 2025 am 12:20 AM

ACID属性包括原子性、一致性、隔离性和持久性，是数据库设计的基石。1.原子性确保事务要么完全成功，要么完全失败。2.一致性保证数据库在事务前后保持一致状态。3.隔离性确保事务之间互不干扰。4.持久性确保事务提交后数据永久保存。

MySQL：数据库管理系统与编程语言Apr 16, 2025 am 12:19 AM

MySQL既是数据库管理系统（DBMS），也与编程语言紧密相关。1）作为DBMS，MySQL用于存储、组织和检索数据，优化索引可提高查询性能。2）通过SQL与编程语言结合，嵌入在如Python中，使用ORM工具如SQLAlchemy可简化操作。3）性能优化包括索引、查询、缓存、分库分表和事务管理。

mySQL：使用SQL命令管理数据Apr 16, 2025 am 12:19 AM

MySQL使用SQL命令管理数据。1.基本命令包括SELECT、INSERT、UPDATE和DELETE。2.高级用法涉及JOIN、子查询和聚合函数。3.常见错误有语法、逻辑和性能问题。4.优化技巧包括使用索引、避免SELECT*和使用LIMIT。

MySQL的目的：有效存储和管理数据Apr 16, 2025 am 12:16 AM

MySQL是一种高效的关系型数据库管理系统，适用于存储和管理数据。其优势包括高性能查询、灵活的事务处理和丰富的数据类型。实际应用中，MySQL常用于电商平台、社交网络和内容管理系统，但需注意性能优化、数据安全和扩展性。

SQL和MySQL：了解关系Apr 16, 2025 am 12:14 AM

SQL和MySQL的关系是标准语言与具体实现的关系。1.SQL是用于管理和操作关系数据库的标准语言，允许进行数据的增、删、改、查。2.MySQL是一个具体的数据库管理系统，使用SQL作为其操作语言，并提供高效的数据存储和管理。

说明InnoDB重做日志和撤消日志的作用。Apr 15, 2025 am 12:16 AM

InnoDB使用redologs和undologs确保数据一致性和可靠性。1.redologs记录数据页修改，确保崩溃恢复和事务持久性。2.undologs记录数据原始值，支持事务回滚和MVCC。

在解释输出（类型，键，行，额外）中要查找的关键指标是什么？Apr 15, 2025 am 12:15 AM

EXPLAIN命令的关键指标包括type、key、rows和Extra。1）type反映查询的访问类型，值越高效率越高，如const优于ALL。2）key显示使用的索引，NULL表示无索引。3）rows预估扫描行数，影响查询性能。4）Extra提供额外信息，如Usingfilesort提示需要优化。

在解释中使用临时状态以及如何避免它是什么？Apr 15, 2025 am 12:14 AM

Usingtemporary在MySQL查询中表示需要创建临时表，常见于使用DISTINCT、GROUPBY或非索引列的ORDERBY。可以通过优化索引和重写查询避免其出现，提升查询性能。具体来说，Usingtemporary出现在EXPLAIN输出中时，意味着MySQL需要创建临时表来处理查询。这通常发生在以下情况：1)使用DISTINCT或GROUPBY时进行去重或分组；2)ORDERBY包含非索引列时进行排序；3)使用复杂的子查询或联接操作。优化方法包括：1)为ORDERBY和GROUPB

See all articles