hadoop
Edithttp://developer.yahoo.com/blogs/hadoop/
http://lucene.apache.org/hadoop/ http://en.wikipedia.org/wiki/Hadoop
http://www.jco.or.kr/conference/data/10th/Merlin-1.zip
아파치 하둡 맵리듀스 기반 애플리케이션 구현하기 Part 1
Hadoop을 이용한 분산 데이터 처리, Part 3: 애플리케이션 개발
Apache Hadoop과 Dojo를 사용하여 저비용으로 비즈니스 인텔리전스 데이터 생성하기, Part 1: Apache Hadoop을 사용하여 기존 데이터 처리하기
Hadoop 업체 제휴 상황
예제
Hadoop 간단 요약
내부적으로 분산 병렬 처리를 지원하고 사용자에게 모든 처리과정을 추상화한 인터페이스를 제공한다.
Hadoop was inspired by Google's MapReduce and Google File System (GFS) papers.
HDFS filesystem uses
- HBase - BigTable-model database.
- : data warehouse infrastructure built on top of Hadoop. SQL-like query language, called QL, that HBase는 HDFS를 기반으로 하는 또 하나의 흥미로운 애플리케이션으로 Google BigTable과 비슷한 고성능 데이터베이스 시스템이다. 일반적인 파일 처리 대신 HBase는 데이터베이스 테이블을 입력 및 출력 양식으로 사용하여 MapReduce 처리를 수행한다.
Eclipse plugin
http://www.alphaworks.ibm.com/tech/mapreducetools/
주요개념
논문
하둡 분산 파일 시스템: 구조와 설계(The Hadoop Distributed File System: Architecture and Design)
Linux에 mount
FTP
https://sites.google.com/a/iponweb.net/hadoop/Home/hdfs-over-ftp[https://sites.google.com/a/iponweb.net/hadoop/Home/hdfs-over-ftp]
Stream 얻기
Path
FileSystem
Configuration
Hadoop command
hadoop fs -ls
bin/hadoop jar sims-batch.jar sims.batch.WriteTest
http://www.mail-archive.com/core-user@hadoop.apache.org/msg07497.html
Database Inout
http://developer.yahoo.net/blogs/hadoop/DBInputFormat.ppt
http://www.cloudera.com/blog/wp-content/uploads/DBInputFormat.pdf
http://www.cloudera.com/blog/2009/03/06/database-access-with-hadoop/
http://www.cloudera.com/blog/tag/dbinputformat/
http://www.mail-archive.com/core-user@hadoop.apache.org/msg07497.html
DBOutputFormat
DBInputFormat
DBConfiguration
public int run(String[] arg0) throws Exception {
JobConf conf = new JobConf(getConf(), LoadTable1.class);
conf.setInputFormat(DBInputFormat.class);
DBConfiguration.configureDB(conf, DATABASE_DRIVER_CLASS, CONNECT_URL, DB_USER, DB_PWD);
DBInputFormat.setInput(conf, ose_epr_contract.class, "select CONTRACT_NUMBER from OSE_EPR_CONTRACT", "select COUNT(CONTRACT_NUMBER) from OSE_EPR_CONTRACT");
FileOutputFormat.setOutputPath(conf, new Path(CONTRACT_OUTPUT_PATH));
conf.setMapperClass(LoadMapper.class);
conf.setNumReduceTasks(0); conf.setOutputKeyClass(Text.class);
conf.setOutputValueClass(NullWritable.class);
JobClient.runJob(conf); return 0; }
Hadoop DB
http://db.cs.yale.edu/hadoopdb/hadoopdb.html
http://db.cs.yale.edu/hadoopdb/hadoopdb.html
ZooKeeper
Hadoop + ETL
http://www.slideshare.net/ydn/4-integration-patternshadoopsummit2010