如何在 Python 中读取给定像素的 RGB 值?

如果我用 open("image.jpg")打开一个图像,假设我有像素的坐标,我如何得到像素的 RGB 值?

那么,我怎样才能做到相反的事情呢?从一个空白的图形开始,“写”一个像素具有一定的 RGB 值?

如果不需要下载任何其他库,我会更喜欢。

441592 次浏览

图像处理是一个复杂的主题,最好使用 库。我可以推荐使用 Gdmodule,它提供了从 Python 中轻松访问许多不同图像格式的方法。

这可能是最好的使用 Python 图像库这样做,我担心这是一个单独的下载。

最简单的方法是通过 在 Image 对象上加载()方法返回一个像素访问对象,你可以像操作一个数组:

from PIL import Image


im = Image.open('dead_parrot.jpg') # Can be many different formats.
pix = im.load()
print im.size  # Get the width and hight of the image for iterating over
print pix[x,y]  # Get the RGBA Value of the a pixel of an image
pix[x,y] = value  # Set the RGBA Value of the image (tuple)
im.save('alive_parrot.png')  # Save the modified pixels as .png

或者,看看 图像绘制,它为创建图像提供了更丰富的 API。

有一篇很好的关于 wiki.wxpython.org 的文章叫做 使用图像。本文提到了使用 wxWidgets (wxImage)、 PIL 或 Python Magick 的可能性。就我个人而言,我使用过 PIL 和 wxWidgets,它们都使图像操作相当容易。

轻量级 PNG 解码器/编码器

虽然这个问题暗示了 JPG,但我希望我的答案对一些人有用。

下面是如何使用 PyPNG 模块读写 PNG 像素:

import png, array


point = (2, 10) # coordinates of pixel to be painted red


reader = png.Reader(filename='image.png')
w, h, pixels, metadata = reader.read_flat()
pixel_byte_width = 4 if metadata['alpha'] else 3
pixel_position = point[0] + point[1] * w
new_pixel_value = (255, 0, 0, 0) if metadata['alpha'] else (255, 0, 0)
pixels[
pixel_position * pixel_byte_width :
(pixel_position + 1) * pixel_byte_width] = array.array('B', new_pixel_value)


output = open('image-with-red-dot.png', 'wb')
writer = png.Writer(w, h, **metadata)
writer.write_array(output, pixels)
output.close()

PyPNG 是一个单独的纯 Python 模块,长度不到4000行,包括测试和注释。

PIL 是一个更全面的图像库,但是它也显著地更重。

您可以使用 玩具的 surfarray 模块。这个模块有一个3d 像素数组返回方法,称为像素3d (表面)。我已经展示了下面的用法:

from pygame import surfarray, image, display
import pygame
import numpy #important to import


pygame.init()
image = image.load("myimagefile.jpg") #surface to render
resolution = (image.get_width(),image.get_height())
screen = display.set_mode(resolution) #create space for display
screen.blit(image, (0,0)) #superpose image on screen
display.flip()
surfarray.use_arraytype("numpy") #important!
screenpix = surfarray.pixels3d(image) #pixels in 3d array:
#[x][y][rgb]
for y in range(resolution[1]):
for x in range(resolution[0]):
for color in range(3):
screenpix[x][y][color] += 128
#reverting colors
screen.blit(surfarray.make_surface(screenpix), (0,0)) #superpose on screen
display.flip() #update display
while 1:
print finished

我希望能有所帮助。最后一句话: 屏幕终身锁定。

正如戴夫•韦伯(Dave Webb)所言:

下面是我的工作代码片段,它从 图片来源:

import os, sys
import Image


im = Image.open("image.jpg")
x = 3
y = 4


pix = im.load()
print pix[x,y]

使用命令“ sudo apt-get install python-image”安装 PIL 并运行以下程序。它将打印图像的 RGB 值。如果图像很大,使用’>’将输出重定向到一个文件,然后打开该文件查看 RGB 值

import PIL
import Image
FILENAME='fn.gif' #image can be in gif jpeg or png format
im=Image.open(FILENAME).convert('RGB')
pix=im.load()
w=im.size[0]
h=im.size[1]
for i in range(w):
for j in range(h):
print pix[i,j]

您可以使用 Tkinter 模块,它是 Tk GUI 工具箱的标准 Python 接口,不需要额外的下载。参见 https://docs.python.org/2/library/tkinter.html

(对于 Python 3,Tkinter 被重命名为 Tkinter)

下面是如何设置 RGB 值:

#from http://tkinter.unpythonic.net/wiki/PhotoImage
from Tkinter import *


root = Tk()


def pixel(image, pos, color):
"""Place pixel at pos=(x,y) on image, with color=(r,g,b)."""
r,g,b = color
x,y = pos
image.put("#%02x%02x%02x" % (r,g,b), (y, x))


photo = PhotoImage(width=32, height=32)


pixel(photo, (16,16), (255,0,0))  # One lone pixel in the middle...


label = Label(root, image=photo)
label.grid()
root.mainloop()

还有 RGB:

#from http://www.kosbie.net/cmu/spring-14/15-112/handouts/steganographyEncoder.py
def getRGB(image, x, y):
value = image.get(x, y)
return tuple(map(int, value.split(" ")))

使用 枕头(它可以与 Python 3.X 和 Python 2.7 + 一起工作) ,您可以执行以下操作:

from PIL import Image
im = Image.open('image.jpg', 'r')
width, height = im.size
pixel_values = list(im.getdata())

现在你有了所有的像素值。如果它是 RGB 或其他模式可以读取的 im.mode。然后你可以得到像素 (x, y)通过:

pixel_values[width*y+x]

或者,您可以使用 Numpy 并重新设置数组的形状:

>>> pixel_values = numpy.array(pixel_values).reshape((width, height, 3))
>>> x, y = 0, 1
>>> pixel_values[x][y]
[ 18  18  12]

一个完整的、简单易用的解决方案是

# Third party modules
import numpy
from PIL import Image




def get_image(image_path):
"""Get a numpy array of an image so that one can access values[x][y]."""
image = Image.open(image_path, "r")
width, height = image.size
pixel_values = list(image.getdata())
if image.mode == "RGB":
channels = 3
elif image.mode == "L":
channels = 1
else:
print("Unknown mode: %s" % image.mode)
return None
pixel_values = numpy.array(pixel_values).reshape((width, height, channels))
return pixel_values




image = get_image("gradient.png")


print(image[0])
print(image.shape)

烟雾测试代码

你可能不确定宽度/高度/通道的顺序,因此我创建了这个渐变:

enter image description here

该图像的宽度为100px,高度为26px。它有一个颜色渐变从 #ffaa00(黄色)到 #ffffff(白色)。输出结果是:

[[255 172   5]
[255 172   5]
[255 172   5]
[255 171   5]
[255 172   5]
[255 172   5]
[255 171   5]
[255 171   5]
[255 171   5]
[255 172   5]
[255 172   5]
[255 171   5]
[255 171   5]
[255 172   5]
[255 172   5]
[255 172   5]
[255 171   5]
[255 172   5]
[255 172   5]
[255 171   5]
[255 171   5]
[255 172   4]
[255 172   5]
[255 171   5]
[255 171   5]
[255 172   5]]
(100, 26, 3)

注意事项:

  • 形状是(宽度、高度、通道)
  • image[0],也就是第一行,有26个相同颜色的三倍体
photo = Image.open('IN.jpg') #your image
photo = photo.convert('RGB')


width = photo.size[0] #define W and H
height = photo.size[1]


for y in range(0, height): #each pixel has coordinates
row = ""
for x in range(0, width):


RGB = photo.getpixel((x,y))
R,G,B = RGB  #now you can use the RGB value
import matplotlib.pyplot as plt
import matplotlib.image as mpimg


img=mpimg.imread('Cricket_ACT_official_logo.png')
imgplot = plt.imshow(img)

如果你正在寻找一个 RGB 颜色代码的形式有三个数字,下面的代码应该做到这一点。

i = Image.open(path)
pixels = i.load() # this is not a list, nor is it list()'able
width, height = i.size


all_pixels = []
for x in range(width):
for y in range(height):
cpixel = pixels[x, y]
all_pixels.append(cpixel)

这可能对你有用。

使用一个名为 Pillow 的库,您可以将其变成一个函数,以便稍后在您的程序中易于使用,如果您必须多次使用它的话。 该函数只是获取图像的路径和要“抓取”的像素的坐标它打开图像,将其转换为 RGB 颜色空间,并返回所请求像素的 R、 G 和 B。

from PIL import Image
def rgb_of_pixel(img_path, x, y):
im = Image.open(img_path).convert('RGB')
r, g, b = im.getpixel((x, y))
a = (r, g, b)
return a

* 注意: 我不是本代码的最初作者; 没有作出任何解释。因为它是相当容易解释,我只是提供说解释,只是为了以防有人下来不明白它。