数据挖掘方面重要会议的最佳paper集合-mysql チュートリアル-php.cn

ホームページ

データベース

mysql チュートリアル

数据挖掘方面重要会议的最佳paper集合

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 03:56 PM

データマイニング最適な集める

数据挖掘方面重要会议的最佳paper集合，后续将陆续分析一下内容：主要有KDD、SIGMOD、VLDB、ICML、SIGIR KDD (Data Mining) 2013 Simple and Deterministic Matrix Sketching Edo Liberty, Yahoo! Research 2012 Searching and Mining Trillions of Time Se

数据挖掘方面重要会议的最佳paper集合，后续将陆续分析一下内容：

主要有KDD、SIGMOD、VLDB、ICML、SIGIR

KDD (Data Mining)
2013	Simple and Deterministic Matrix Sketching	Edo Liberty, Yahoo! Research
2012	Searching and Mining Trillions of Time Series Subsequences under Dynamic Time Warping	Thanawin Rakthanmanon, University of California Riverside; et al.
2011	Leakage in Data Mining: Formulation, Detection, and Avoidance	Shachar Kaufman, Tel-Aviv University; et al.
2010	Large linear classification when data cannot fit in memory	Hsiang-Fu Yu, National Taiwan University; et al.
2010	Connecting the dots between news articles	Dafna Shahaf & Carlos Guestrin, Carnegie Mellon University
2009	Collaborative Filtering with Temporal Dynamics	Yehuda Koren, Yahoo! Research
2008	Fastanova: an efficient algorithm for genome-wide association study	Xiang Zhang, University of North Carolina at Chapel Hill; et al.
2007	Predictive discrete latent factor models for large scale dyadic data	Deepak Agarwal & Srujana Merugu, Yahoo! Research
2006	Training linear SVMs in linear time	Thorsten Joachims, Cornell University
2005	Graphs over time: densification laws, shrinking diameters and possible explanations	Jure Leskovec, Carnegie Mellon University; et al.
2004	A probabilistic framework for semi-supervised clustering	Sugato Basu, University of Texas at Austin; et al.
2003	Maximizing the spread of influence through a social network	David Kempe, Cornell University; et al.
2002	Pattern discovery in sequences under a Markov assumption	Darya Chudova & Padhraic Smyth, University of California Irvine
2001	Robust space transformations for distance-based operations	Edwin M. Knorr, University of British Columbia; et al.
2000	Hancock: a language for extracting signatures from data streams	Corinna Cortes, AT&T Laboratories; et al.
1999	MetaCost: a general method for making classifiers cost-sensitive	Pedro Domingos, Universidade Técnica de Lisboa
1998	Occam's Two Razors: The Sharp and the Blunt	Pedro Domingos, Universidade Técnica de Lisboa
1997	Analysis and Visualization of Classifier Performance: Comparison under Imprecise Class and Cost Di...	Foster Provost & Tom Fawcett, NYNEX Science and Technology

SIGMOD (Databases)
2013	Massive Graph Triangulation	Xiaocheng Hu, The Chinese University of Hong Kong; et al.
2012	High-Performance Complex Event Processing over XML Streams	Barzan Mozafari, Massachusetts Institute of Technology; et al.
2011	Entangled Queries: Enabling Declarative Data-Driven Coordination	Nitin Gupta, Cornell University; et al.
2010	FAST: fast architecture sensitive tree search on modern CPUs and GPUs	Changkyu Kim, Intel; et al.
2009	Generating example data for dataflow programs	Christopher Olston, Yahoo! Research; et al.
2008	Serializable isolation for snapshot databases	Michael J. Cahill, University of Sydney; et al.
2008	Scalable Network Distance Browsing in Spatial Databases	Hanan Samet, University of Maryland; et al.
2007	Compiling mappings to bridge applications and databases	Sergey Melnik, Microsoft Research; et al.
2007	Scalable Approximate Query Processing with the DBO Engine	Christopher Jermaine, University of Florida; et al.
2006	To search or to crawl?: towards a query optimizer for text-centric tasks	Panagiotis G. Ipeirotis, New York University; et al.
2004	Indexing spatio-temporal trajectories with Chebyshev polynomials	Yuhan Cai & Raymond T. Ng, University of British Columbia
2003	Spreadsheets in RDBMS for OLAP	Andrew Witkowski, Oracle; et al.
2001	Locally adaptive dimensionality reduction for indexing large time series databases	Eamonn Keogh, University of California Irvine; et al.
2000	XMill: an efficient compressor for XML data	Hartmut Liefke, University of Pennsylvania Dan Suciu, AT&T Laboratories
1999	DynaMat: a dynamic view management system for data warehouses	Yannis Kotidis & Nick Roussopoulos, University of Maryland
1998	Efficient transparent application recovery in client-server information systems	David Lomet & Gerhard Weikum, Microsoft Research
1998	Integrating association rule mining with relational database systems: alternatives and implications	Sunita Sarawagi, IBM Research; et al.
1997	Fast parallel similarity search in multimedia databases	Stefan Berchtold, University of Munich; et al.
1996	Implementing data cubes efficiently	Venky Harinarayan, Stanford University; et al.

VLDB (Databases)
2013	DisC Diversity: Result Diversification based on Dissimilarity and Coverage	Marina Drosou & Evaggelia Pitoura, University of Ioannina
2012	Dense Subgraph Maintenance under Streaming Edge Weight Updates for Real-time Story Identification	Albert Angel, University of Toronto; et al.
2011	RemusDB: Transparent High-Availability for Database Systems	Umar Farooq Minhas, University of Waterloo; et al.
2010	Towards Certain Fixes with Editing Rules and Master Data	Shuai Ma, University of Edinburgh; et al.
2009	A Unified Approach to Ranking in Probabilistic Databases	Jian Li, University of Maryland; et al.
2008	Finding Frequent Items in Data Streams	Graham Cormode & Marios Hadjieleftheriou, AT&T Laboratories
2008	Constrained Physical Design Tuning	Nicolas Bruno & Surajit Chaudhuri, Microsoft Research
2007	Scalable Semantic Web Data Management Using Vertical Partitioning	Daniel J. Abadi, Massachusetts Institute of Technology; et al.
2006	Trustworthy Keyword Search for Regulatory-Compliant Records Retention	Soumyadeb Mitra, University of Illinois at Urbana-Champaign; et al.
2005	Cache-conscious Frequent Pattern Mining on a Modern Processor	Amol Ghoting, Ohio State University; et al.
2004	Model-Driven Data Acquisition in Sensor Networks	Amol Deshpande, University of California Berkeley; et al.
2001	Weaving Relations for Cache Performance	Anastassia Ailamaki, Carnegie Mellon University; et al.
1997	Integrating Reliable Memory in Databases	Wee Teck Ng & Peter M. Chen, University of Michigan

ICML (Machine Learning)
2013	Vanishing Component Analysis	Roi Livni, The Hebrew University of Jerusalum; et al.
2013	Fast Semidifferential-based Submodular Function Optimization	Rishabh Iyer, University of Washington; et al.
2012	Bayesian Posterior Sampling via Stochastic Gradient Fisher Scoring	Sungjin Ahn, University of California Irvine; et al.
2011	Computational Rationalization: The Inverse Equilibrium Problem	Kevin Waugh, Carnegie Mellon University; et al.
2010	Hilbert Space Embeddings of Hidden Markov Models	Le Song, Carnegie Mellon University; et al.
2009	Structure preserving embedding	Blake Shaw & Tony Jebara, Columbia University
2008	SVM Optimization: Inverse Dependence on Training Set Size	Shai Shalev-Shwartz & Nathan Srebro, Toyota Technological Institute at Chicago
2007	Information-theoretic metric learning	Jason V. Davis, University of Texas at Austin; et al.
2006	Trading convexity for scalability	Ronan Collobert, NEC Labs America; et al.
2005	A support vector method for multivariate performance measures	Thorsten Joachims, Cornell University
1999	Least-Squares Temporal Difference Learning	Justin A. Boyan, NASA Ames Research Center

SIGIR (Information Retrieval)
2013	Beliefs and Biases in Web Search	Ryen W. White, Microsoft Research
2012	Time-Based Calibration of Effectiveness Measures	Mark Smucker & Charles Clarke, University of Waterloo
2011	Find It If You Can: A Game for Modeling Different Types of Web Search Success Using Interaction Data	Mikhail Ageev, Moscow State University; et al.
2010	Assessing the Scenic Route: Measuring the Value of Search Trails in Web Logs	Ryen W. White, Microsoft Research Jeff Huang, University of Washington
2009	Sources of evidence for vertical selection	Jaime Arguello, Carnegie Mellon University; et al.
2008	Algorithmic Mediation for Collaborative Exploratory Search	Jeremy Pickens, FX Palo Alto Lab; et al.
2007	Studying the Use of Popular Destinations to Enhance Web Search Interaction	Ryen W. White, Microsoft Research; et al.
2006	Minimal Test Collections for Retrieval Evaluation	Ben Carterette, University of Massachusetts Amherst; et al.
2005	Learning to estimate query difficulty: including applications to missing content detection and dis...	Elad Yom-Tov, IBM Research; et al.
2004	A Formal Study of Information Retrieval Heuristics	Hui Fang, University of Illinois at Urbana-Champaign; et al.
2003	Re-examining the potential effectiveness of interactive query expansion	Ian Ruthven, University of Strathclyde
2002	Novelty and redundancy detection in adaptive filtering	Yi Zhang, Carnegie Mellon University; et al.
2001	Temporal summaries of new topics	James Allan, University of Massachusetts Amherst; et al.
2000	IR evaluation methods for retrieving highly relevant documents	Kalervo J?rvelin & Jaana Kek?l?inen, University of Tampere
1999	Cross-language information retrieval based on parallel texts and automatic mining of parallel text...	Jian-Yun Nie, Université de Montréal; et al.
1998	A theory of term weighting based on exploratory data analysis	Warren R. Greiff, University of Massachusetts Amherst
1997	Feature selection, perceptron learning, and a usability case study for text categorization	Hwee Tou Ng, DSO National Laboratories; et al.
1996	Retrieving spoken documents by combining multiple index sources	Gareth Jones, University of Cambridge; et al.

推荐一个网站，感谢作者的努力搜集，主要是各种顶级会议的最佳论文集合。

http://jeffhuang.com/best_paper_awards.html

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

如何使用 Go 语言进行数据挖掘？Jun 10, 2023 am 08:39 AM

随着大数据和数据挖掘的兴起，越来越多的编程语言开始支持数据挖掘的功能。Go语言作为一种快速、安全、高效的编程语言，也可以用于数据挖掘。那么，如何使用Go语言进行数据挖掘呢？以下是一些重要的步骤和技术。数据获取首先，你需要获取数据。这可以通过各种途径实现，比如爬取网页上的信息、使用API获取数据、从数据库中读取数据等等。Go语言自带了丰富的HTTP

MySql的数据分析：如何处理数据挖掘和统计Jun 16, 2023 am 11:43 AM

MySql是一款流行的关系型数据库管理系统，广泛应用于企业和个人的数据存储和管理中。除了存储和查询数据外，MySql还提供了一些功能，如数据分析、数据挖掘和统计，可以帮助用户更好地理解和利用数据。数据在任何企业或组织中都是宝贵的资产，通过数据分析可以帮助企业做出正确的业务决策。MySql可以通过多种方式进行数据分析和数据挖掘，以下是一些实用的技术和工具：使用

数据挖掘和数据分析的区别是什么？Dec 07, 2020 pm 03:16 PM

区别：1、“数据分析”得出的结论是人的智力活动结果，而“数据挖掘”得出的结论是机器从学习集【或训练集、样本集】发现的知识规则；2、“数据分析”不能建立数学模型，需要人工建模，而“数据挖掘”直接完成了数学建模。

Python中的时间序列预测技巧Jun 10, 2023 am 08:10 AM

随着数据时代的到来，越来越多的数据被收集并用于分析和预测。时间序列数据是一种常见的数据类型，它包含了基于时间的一连串数据。用于预测这类数据的方法被称为时间序列预测技术。Python是一种十分流行的编程语言，拥有强大的数据科学和机器学习支持，因此它也是一种非常适合进行时间序列预测的工具。本文将介绍Python中一些常用的时间序列预测技巧，并提供一些在实际项目中

火山引擎工具技术分享：用 AI 完成数据挖掘，零门槛完成 SQL 撰写May 18, 2023 pm 08:19 PM

在使用BI工具的时候，经常遇到的问题是：“不会SQL怎么生产加工数据、不会算法可不可以做挖掘分析？”而专业算法团队在做数据挖掘时，数据分析及可视化也会呈现相对割裂的现象。流程化完成算法建模和数据分析工作，也是一个提效的好办法。同时，对于专业数仓团队来说，相同主题的数据内容面临“重复建设，使用和管理时相对分散”的问题——究竟有没有办法在一个任务里同时生产，同主题不同内容的数据集？生产的数据集可不可以作为输入重新参与数据建设？1.DataWind可视化建模能力来了由火山引擎推出的BI平台Da

Redis在人工智能与数据挖掘中的应用实践Jun 20, 2023 pm 07:10 PM

随着人工智能和大数据技术的兴起，越来越多的公司和业务开始关注如何对数据进行高效的存储和处理。Redis作为一种高性能的分布式内存数据库，越来越受到人工智能和数据挖掘领域的关注。本文将从Redis的特点及其在人工智能和数据挖掘应用中的实践做一个简单介绍。Redis是一种开源、高性能、可扩展的NoSQL数据库。它支持多种数据结构、提供用于缓存、消息队列和计数器等

PHP中如何进行自动文本分类和数据挖掘？May 22, 2023 pm 02:31 PM

PHP是一种优秀的服务器端脚本语言，广泛应用于网站开发和数据处理等领域。随着互联网的快速发展，数据量的不断增加，如何高效地进行自动文本分类和数据挖掘成为了一个重要的问题。本文将介绍在PHP中进行自动文本分类和数据挖掘的方法和技巧。一、什么是自动文本分类和数据挖掘？自动文本分类是指根据文本内容自动将文本进行分类的过程，通常使用机器学习算法进行实现。数据挖掘是指

Python中的Apriori算法详解Jun 10, 2023 am 08:03 AM

Apriori算法是数据挖掘领域中关联规则挖掘的一种常见方法，被广泛应用于商业智能、市场营销等领域。Python作为一种通用的编程语言，也提供了多个第三方库来实现Apriori算法，本文将详细介绍Python中Apriori算法的原理、实现及应用。一、Apriori算法原理在介绍Apriori算法原理之前，先来学习下两个关联规则挖掘中的概念：频繁项集和支持度

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SublimeText3 中国語版

中国語版、とても使いやすい

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、