資料樣式如下,如何用mapReduce進行統計 性別是男性的小孩有多少? (小朋友的性命未知,數據結構感人!_!)
一個db的集合里大約有百萬級的這樣的數據
{
"name":"向日癸班的小贫油",
"小新":{
"姓名":"小新",
"年龄":"6",
"性别":"男"
},
"妮妮":{
"姓名":"妮妮",
"年龄":"7",
"性别":"女"
},
"风间":{
"姓名":"风间",
"年龄":"7",
"性别":"男"
},
"阿呆":{
"姓名":"阿呆",
"年龄":"6",
"性别":"男"
},
.
.
.
.
.
}
仅有的幸福2017-04-27 09:04:22
對於這個資料結構使用MapReduce做統計,不知道樓主找到解決方法了沒有?首先不能確定一筆記錄有多少像
"阿呆":{
"姓名":"阿呆",
"年龄":"6",
"性别":"男"
}
這樣的數據,而且map的key你也不是固定的,所以比較難定位到性別這個欄位。我能想到的實作就是在程式中做統計,也就是從資料庫中取出。如果樓主實現了MapReduce的統計,希望共享一下實現,謝謝