Having difficulty in mapreduce to understand(mapreduce 难以理解)
问题描述
我已经看到下面的链接,它是使用 python 开始 mapreduce 的链接
I have seen the below link which is of getting started mapreduce with python
http://code.google.com/p/appengine-mapreduce/wiki/GettingStartedInPython
但我仍然无法理解它是如何工作的.我正在执行下面的代码,但无法理解到底发生了什么?
But still I am not able to understand how its working. I am executing below code but not able to understand what exactly is happening?
mapreduce.yaml
mapreduce:
- name: Testmapper
mapper:
input_reader: mapreduce.input_readers.DatastoreInputReader
handler: main.process
params:
- name: entity_kind
default: main.userDetail
mapreduce/main.py
some code
class userDetail(db.Model):
name = db.StringProperty()
some code
def process(u):
u.name="mahesh"
yield op.db.Put(u)
我正在执行此操作,它在状态页面中为我提供了 status = success.
I am executing this and it gives me status = success in status page.
但无法理解发生了什么
我想用 mapreduce 做的主要事情是从实体中搜索或计算记录
The main thing I want do with mapreduce is to search or count records from entity
那么任何人都可以帮助我吗??
So anyone can please help me??
提前致谢
推荐答案
您正在将 "mahesh"
值设置为所有 userDetail 的
StringProperty name
实体.
You are setting the "mahesh"
value to the StringProperty name
of all your userDetail
entities.
如果您想计算您的实体,请使用:
If you want to count your entities use :
from mapreduce import operation as op
def process(entity):
yield op.counters.Increment("counter1")
这篇关于mapreduce 难以理解的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
本文标题为:mapreduce 难以理解


基础教程推荐
- 修改列表中的数据帧不起作用 2022-01-01
- PANDA VALUE_COUNTS包含GROUP BY之前的所有值 2022-01-01
- Plotly:如何设置绘图图形的样式,使其不显示缺失日期的间隙? 2022-01-01
- 在Python中从Azure BLOB存储中读取文件 2022-01-01
- PermissionError: pip 从 8.1.1 升级到 8.1.2 2022-01-01
- 包装空间模型 2022-01-01
- 求两个直方图的卷积 2022-01-01
- 使用大型矩阵时禁止 Pycharm 输出中的自动换行符 2022-01-01
- 无法导入 Pytorch [WinError 126] 找不到指定的模块 2022-01-01
- 在同一图形上绘制Bokeh的烛台和音量条 2022-01-01