Thử dùng AI Grok để chỉnh sửa ảnh, so sánh nhanh với Gemini 2.0

24/03/2025 10:15
Thử dùng AI Grok để chỉnh sửa ảnh, so sánh nhanh với Gemini 2.0

Hiện tại người dùng X mua gói Premium+ đã được dùng thử tính năng chỉnh sửa hình ảnh tải lên. Mình có dùng thử một loạt các tình huống và so sánh nhanh luôn với Gemini Flash 2.0 qua Google AI Studio, xin chia sẻ với các bạn.


Nhận xét chung:

  • AI sẽ gen cùng lúc ra 2 bức ảnh thay vì 1 như Gemini
  • Grok trả về ảnh có độ phân giải cao
  • Khả năng thêm các chi tiết vào vật thể khá tốt
  • Xử lý chữ trên ảnh khá tốt, thêm được cả chữ tiếng Việt
  • Ảnh do AI gen ra có xu hướng thêm các chi tiết khác, không giữ hoàn toàn những chi tiết trong ảnh
  • Grok hiện chỉ cho tải lên 1 ảnh nên chưa làm được trò ghép nội dung 2 ảnh lại với nhau.

Phục hồi ảnh cũ


Mình thử tải bức ảnh bị xước lên và đây là kết quả của Grok. Grok sẽ tạo ra cùng lúc luôn 2 ảnh cho người dùng chọn, ảnh độ phân giải cao và mịn màng.


Đây là cùng một prOmpt tải lên Gemini Flash 2.0. Có thể thấy Gemini giữ lại đặc tính của bức ảnh tốt hơn.


Sửa ảnh nhắm mắt


Trong tình huống ảnh chụp bị nhắm mắt. Mình kêu Grok sửa thành cô gái trong ảnh đang nhìn vào ống kính là nó hiểu ngay và trả về kết quả như thế này. 2 ảnh đều rất hài lòng.


Với Gemini thì nhập prOmpt tương tự như Grok thì Gemini chưa nhận diện được. Phải sửa prOmpt lại một chút là kêu nó mở mắt ra trước, rồi mới nhìn vào máy thì mới dược.


Nhiều góc chụp từ ảnh chân dung


Trong tình huống này mình kêu Grok cho bức ảnh chụp nghiêng của cô gái. 2 ảnh AI tạo ra đều rất ưng, giữ nguyên được đường nét của gương mặt cô gái cũng như trang phục.


Đây là kết quả của Gemini, cũng tốt.


Thử thêm tình huống kêu Grok chuyển sang ảnh chụp từ trên xuống thì Grok không nhận diện được.


Đây là kết quả từ Gemini.


Thêm vật thể vào ảnh nội thất


Đây là kết quả của Grok thêm vào. Cơ bản cấu trúc của toàn bộ nội thất được giữ lại. Thể hiện đúng ý đồ là thêm vảo bàn ăn cho 6 người. Tuy nhiên phong cách của bức ảnh có thay đổi đôi chút.


Đây là kết quả của Gemini Flash 2.0. Yếu tố bàn ăn dành cho 6 người chưa được tuân thủ, chỉ tạo thêm một bàn ăn với 4 ghê. Tuy nhiên cấu trúc và phong cách của toàn bộ ảnh gốc được giữ nguyên.


Thay trang phục


Thử kêu Grok thay trang phục của anh trong ảnh. Đây là kết quả của Grok. Nhìn chung bức ảnh tạo ra vẫn hợp lý, chữ trên banner phía sau được giữ ổn định. Tuy nhiên gương mặt chủ thể thay đổi mạnh.


Đây là kết quả của Gemini. Mặt người được giữ nguyên và áo thay đúng ý.


Thử kêu Grok đeo kính vào


Và tương tự với Gemini


Thêm chi tiết vào ảnh







Tình huống này mình muốn anh trong ảnh cầm que kem thay vì micro. Và đây là kết quả của Grok.




Còn đây là kết quả của Gemini.




Tình huống này, mình kêu Grok thêm con gấu bông vào tay cô gái trong ảnh.




Và đây là kết quả của Gemini.


Thay đổi góc máy





Tình huống này, mình kêu Grok zoom out bức ảnh ra để thấy được toàn bộ người của cô gái trong ảnh. Đây là kết quả của Grok.




Và đây là Gemini. Gương mặt có thay đổi mạnh nhưng đổi lại bối cảnh vẫn được giữ lại.




Thử yêu cầu Grok thay đổi góc chụp sang trực diện cô gái




Và đây là kết quả của Gemini. Cả 2 đều thay đổi gương mặt cô gái luôn.


Thay đổi background





Tình huống này, mình thử kêu Grok thay background thành khung cảnh đêm Giáng Sinh mùa đông, có thêm người phía sau và thêm cả dòng chữ chúc mừng năm mới bằng tiếng Việt vào. Đây là kết quả. Cơ bản thì đường nét của chủ thể vẫn được giữ lại nhưng dòng chữ Chúc mừng năm mới chưa đã lắm.




Đây là kết quả của Gemini, gương mặt cô gái hoàn toàn khác luôn, tuy nhiên background và cả dòng chữ phía sau nhìn tự nhiên hơn khá nhiều.




Thử một bức ảnh gốc khác với Grok.




Và kết quả với Gemini


Viết chữ lên áo







Trong tình huống này, mình kêu Grok thêu thêm dòng chữ lên áo của người này. Có thể thấy dòng chữ tiếng Việt được thể hiện tốt với đầy đủ dấu, để ý kỹ thì textture của dòng chữ thể hiện đúng yếu tố "thêu" lên đó, gương mặt của chủ thể gần như được đảm bảo hoàn toàn. Đánh giá cao bức ảnh này.




Đây là kết quả từ Gemini. Dòng chữ nếu so với Grok tạo thì chưa đã lắm.


Thêm người vào ảnh





Tình huống này mình kêu thêm một cô gái vào ảnh và Grok trả về như thế này. Gương mặt người trong ảnh gốc có biến đổi.




Đây là kết quả của Gemini


Tin xem thêm

Sự Thật Về Cáp USB-C: Phá Bỏ Hiểu Lầm "Cáp iPhone" Và "Cáp Android"

CÔNG NGHỆ
24/12/2025 08:35

Sự Thật Về Cáp USB-C: Phá Bỏ Hiểu Lầm "Cáp iPhone" Và "Cáp Android"

LG UltraGear OLED 45GX950A sau 3 tháng: Vẫn ngợp quá!

CÔNG NGHỆ
24/12/2025 08:32

LG UltraGear OLED 45GX950A sau 3 tháng: Vẫn ngợp quá!

Dân nghiệp dư thay pin + vỏ 8 Plus ios 11 256Gb imei 00000

CÔNG NGHỆ
24/12/2025 08:29

Dân nghiệp dư thay pin + vỏ 8 Plus ios 11 256Gb imei 00000

iOS 26 bổ sung một tính năng giúp anh em không còn vô tình mở camera điện thoại

CÔNG NGHỆ
23/12/2025 13:00

iOS 26 bổ sung một tính năng giúp anh em không còn vô tình mở camera điện thoại

Cuộc khủng hoảng hiện tại của DRAM (giai đoạn 2025-2028)

CÔNG NGHỆ
23/12/2025 12:56

Cuộc khủng hoảng hiện tại của DRAM (giai đoạn 2025-2028)

Bạn đã có thể dùng Apple Intelligence để trả cứu, hỏi đáp

CÔNG NGHỆ
23/12/2025 12:55

Bạn đã có thể dùng Apple Intelligence để trả cứu, hỏi đáp

[Nhờ giúp đỡ] Kit Apple CarPlay cho Mazda 2018

CÔNG NGHỆ
23/12/2025 12:54

[Nhờ giúp đỡ] Kit Apple CarPlay cho Mazda 2018

Xiaomi 17 Ultra ra mắt 18h 25/12/2025

CÔNG NGHỆ
22/12/2025 23:43

Xiaomi 17 Ultra ra mắt 18h 25/12/2025

Podcast: Nikon ZR cho người làm nội dung video

CÔNG NGHỆ
22/12/2025 23:43

Podcast: Nikon ZR cho người làm nội dung video