Özetçe

Genel görüntü restorasyonu, özellikle karmaşık sahneler ve gürültü içeren görüntüler için bilgisayarla görmede zorlu bir görevdir. Bu sorunu çözmek için Geliştirilmiş Süper Çözünürlüklü Üretken Çekişmeli Ağlar (ESRGAN) gibi genel görüntü restorasyonuna yönelik pratik algoritmalar geliştirilmiştir. ESRGAN, düşük çözünürlüklü girdilerden yüksek çözünürlüklü görüntüler üretmek için, Üretken Çekişmeli Ağlar (GAN) kullanan derin öğrenme tabanlı bir görüntü restorasyon modelidir. Son yıllarda ESRGAN, hava görüntüleri de dahil olmak üzere çeşitli görüntü türleri üzerindeki etkileyici görüntü restorasyon sonuçlarıyla büyük ilgi görmüştür. Hava görüntüleri, görüntülerin kalitesini etkileyen yüksek gürültü, düşük kontrast ve bulanıklık gibi benzersiz zorluklara sahiptir. ESRGAN, bu görüntüleri yeniden canlandırarak görsel kalitelerini artırmak, daha iyi yorumlama ve analiz sağlamak için başarıyla uygulanmıştır. Bu makalede, ESRGAN’a ve hava görüntüleri üzerindeki uygulamasına odaklanarak genel görüntü restorasyonu için pratik algoritmaları gözden geçiriyoruz. ESRGAN‘ın mimarisi ve eğitim stratejilerinin yanı sıra avantajlarını ve sınırlamalarını tartışıyoruz. Ayrıca, ESRGAN‘ın son zamanlarda ek eğitime ihtiyaç duymadan, tanıdık olmayan nesnelere ve görüntülere sıfır çekim genelleme ile hızlı segmentasyon sistemi olan Segment Anything Model (SEM) gibi nesne algılama, sınıflandırma ve segmentasyon uygulamasında nasıl sonuçlar verdiğine dair örnekler sunuyoruz. Bu makalede, (512×512) çözünürlüğe ve 3 bant RGB’ye sahip 917.252 görüntü çipinden oluşan GÖKTÜRK II 2022 İstanbul Hava Görüntüsü kullanılmıştır. Görsel kaliteyi artırmak için, görüntü çipleri 2x ölçekli (1024×1024) çözünürlüğe yükseltilerek dört kat daha büyük bir veri boyutu elde edilmiştir. Bu nedenle, aynı sıkıştırma oranına sahip görüntü 671 GB x 4 = 2,684 TB veriye eşdeğer olacak şekilde ESRGAN algoritmasıyla işlenmiştir. Bu çalışma, ESRGAN‘ın büyük ölçekli ve çeşitli veri kümelerini işleme potansiyelinin yanı sıra tarım, şehir planlama ve afet yönetimi gibi çeşitli alanlarda gerekli olan hava görüntülerinin görsel kalitesini artırma yeteneğini göstermektedir. Potansiyeline rağmen, ESRGAN hava görüntülerine uygulandığında hala çeşitli zorluklarla karşılaşmaktadır. Farklı hava ve ışık koşullarına dayanıklılık, diğer bilgisayarla görme teknikleriyle entegrasyon ve büyük ölçekli ve çeşitli veri kümelerine duyulan ihtiyaç, ele alınması gereken zorluklar arasındadır. Bununla birlikte, ESRGAN ve diğer görüntü restorasyon algoritmaları, havadan görüntü analizinde devrim yaratma ve çok çeşitli uygulamaları kolaylaştırma potansiyeline sahiptir.

1.BAŞLANGIÇ

Uydu görüntülerinin kullanımı çok sayıda uygulamada giderek yaygınlaştıkça, uzamsal çözünürlük ve bunun görüntü kalitesi üzerindeki etkisi üzerine yapılan araştırmalar da önemli ölçüde artmıştır. Bir uydudaki optik sensör tarafından sağlanan uzamsal çözünürlük tipik olarak pikselin ayak izini gösteren nominal bir değer olarak ifade edilirken, gerçek çözünürlük atmosferik ve görüntüleme koşulları, uydunun nadir dışı açısı ve uydunun çalışması veya optiklerinden kaynaklanan artefaktlar gibi çeşitli faktörler nedeniyle farklılık gösterebilir. Yüksek çözünürlüklü (HR) görüntüler elde etmek için bir sensörün optik bileşenlerini geliştirmenin yüksek maliyeti nedeniyle, masrafları azaltmak için yazılım çözümleri aranmıştır. Bu amaçla, uzamsal çözünürlüğü iyileştirmek ve bir veya daha fazla düşük çözünürlüklü (LR) görüntüden HR görüntüler oluşturmak için çeşitli süper çözünürlük (SR) algoritmaları oluşturulmuştur. SR yaklaşımları uydu ve hava görüntüsü işleme, tıbbi görüntü işleme, yüz ve parmak izi görüntüsü iyileştirme, metin görüntüsü iyileştirme ve sıkıştırılmış görüntü ve video iyileştirme gibi çeşitli alanlarda uygulanmıştır. Bu bölümün amacı, modern derin öğrenme (DL) tekniklerini kullanarak uzamsal çözünürlüğü artırmaya odaklanan çalışmanın konusunu tanıtmak, çalışmanın hedeflerini özetlemek ve bölümlerin kısa açıklamalarını sunmaktır. Optik uydu görüntülerinin uzamsal çözünürlüğünü artırmak için kullanılan geleneksel yöntem, sensörün pankromatik ve multispektral (MS) görüntülerinden HR renkli görüntüler üreten pan-sharpening yöntemidir. Temel Bileşen Analizi (PCA), Yoğunluk Ton Doygunluğu (IHS) ve Dalgacık dönüşümü bu amaçla sıklıkla kullanılan füzyon teknikleridir. Renk bozulmaları, veri kümeleri arasında tutarlı olan tam otomatik bir yöntemin olmaması ve operatörün füzyon tekniğiyle ilgili deneyimi gibi geometrik entegrasyona yönelik bazı sınırlamalar vardır.

Daha düşük maliyetle daha yüksek çözünürlük performansı elde etmek için, sensör yapısını değiştirmeden uzamsal çözünürlüğü artırmaya yönelik süper çözünürlük (SR) algoritmaları geliştirilmiştir. SR yaklaşımları, LR uydu görüntülerinin çeşitli uygulamalarda kullanımını önemli ölçüde artırma potansiyeline sahiptir. SR yöntemleri iki geniş kategoride sınıflandırılır: Frekans alanı ve uzamsal alan yaklaşımları. Açıklananlar gibi frekans alanı yaklaşımları hesaplama açısından verimli olsa da, karmaşık problemlerin modellenmesinde yeterince etkili değildir. SR üzerine yapılan sonraki araştırmaların neredeyse tamamı, yüksek hesaplama maliyetine rağmen uzamsal alanda gerçekleştirilmiştir. Uzamsal alanda SR yaklaşımları iki kategoriye ayrılır: tek görüntülü SR (SISR) yaklaşımları ve çok görüntülü SR (MISR) yaklaşımları. SISR, tek bir giriş görüntüsüne dayanarak HR görüntüsü hakkında varsayımlarda bulunabilirken, MISR gizli HR ayrıntılarını görüntüler. MISR, HR görüntülerinin oluşturulması için girdi olarak birden fazla LR görüntüsü gerektirir, ancak tipik olarak yalnızca bir LR görüntüsü mevcuttur. Sonuç olarak, SISR yöntemlerinin kullanımı popülerlik kazanmıştır. Son yıllarda, konvolüsyonel sinir ağları (CNN’ler) ve DL’ye dayalı yöntemlere olan ilgi artmıştır. Özellikle, Generative Adversarial Networks (GANs) gibi yöntemlere dayanan süper çözünürlük çalışmaları, geleneksel pan-sharpening yöntemlerine göre daha tercih edilir hale gelmiştir. GAN tabanlı yaklaşımlar en yüksek doğruluk ve görsel performansa sahip olduğundan, bu çalışmada görüntü uzamsal çözünürlüğünü artırmak için Süper Çözünürlüklü Üretken Çekişmeli Ağlar (SRGAN) ve Geliştirilmiş Süper Çözünürlüklü Üretken Çekişmeli Ağ (ESRGAN) tercih edilmiştir. ESRGAN algoritması ile GÖKTÜRK II İstanbul uydu görüntüsünde yer örnekleme mesafesi (GSD) 50 cm’den 25 cm’ye düşürülürken, görüntüdeki piksel sayısı artırılmış ve her pikselde yakalanan bilginin netliği belirginleştirilmiştir.

2.METOT

Harita Genel Müdürlüğü tarafından temin edilen GÖKTÜRK II uydusu 18 parçadan, Pleiades uydusu ise 4 parçadan oluşmakta olup, her bir görüntü yaklaşık ~50 GB boyutunda olmak üzere İstanbul 2022 uydu görüntüsü toplam 22 paftadan oluşmaktadır. Pafta görüntüleri başlangıçta Raw 2 görüntü olarak alınmış ve ESRGAN algoritması ile işlendikten sonra metaveri bilgilerinin korunmadığı tespit edilmiştir. Görüntüler ortorektifiye edildikten sonra yeniden elde işlenmeye tabi tutulmuşlardır. Uygulamanın görüntü üzerinde etkili olabilmesi için tek bir bilgisayar ile çalışmaya başlanmıştır. Bu çalışmada, ESRGAN algoritması genel kullanıma CPU üzerinde çalışacak şekilde optimize edilmiştir. Fakat, çip görüntülerinin CPU ile işlenmesi çip başına yaklaşık 14 saniye sürdüğünden ve proje zaman çizelgesini geciktirdi görülmüştür. Uygulama performansını artırmak için algoritma Pytorch’ta GPU tensörlerini kullanacak şekilde optimize edilmiştir. Bu çalışmada Pytorch 1.12.1 GPU CUDA 11.6 CUDNN 8.0 sürümü kullanılmıştır. Çip başına işlem gücü 14 saniyeden 5 saniyeye düşürülmüştür. Algoritma, dosyaları tüm çip görüntülerini tek bir dosyadan ayrı ayrı işlemiştir. Çok klasörlü bir sistem kullanılarak ve dosyaları paralel olarak işlemek için iş parçacığı optimizasyonu kullanılmıştır. GPU tensörleri kullanılarak yapılan optimizasyon sonrasında çip başına işlem performansı, bilgisayarın GPU işlem gücüne bağlı olarak 5 saniyeden 1 ila 1,7 saniyeye düşürülmüştür. Tek bir bilgisayarda yüksek performanslı GeForce GTX 3060 grafik kartı kullanılmasına rağmen uygulamanın çip işleme verimliliğinin yeterli olmadığı görülmüştür. Tüm çipleri benzer ve eşit parçalarla paralel biçimde işlemek için 5 sunucu bilgisayar kullanılmıştır. Paralel işlem yapabilmek için dosyaların dağılımı bilgisayarın GPU işlem gücü ile doğrusal orantılı olarak yerel paylaşım klasörleri üzerinden paylaştırma işlemi gerçekleştirilmiştir. Bilgisayarın gücüne göre 1 adet NVIDIA RTX 4000, 2 adet GeForce GTX 3060 ve 2 adet mobil 1080 ekran kartlı bilgisayar için sırasıyla %24, %23, %23, %15 ve %15 paylaşım oranları kullanılmıştır. Her bir harita kesitinden(pafta) elde edilen çip görüntüleri belirtilen oranlarda paylaşımlı klasörlere aktarıldıktan sonra, bu paylaşımlı klasörlerde bulunan çip görüntülerinin, sunucu bilgisayarlarının yerel veri alanlarına aktarılması sağlanmıştır. Çok sayıda çip görüntüsü için her bir verinin tek tek işlenmesi çok fazla zaman aldığından, zaman takibi önemli bir adım olmuş ve mevcut dosyaların işlenme kapasitesini gösterecek zaman ölçüm mekanizmaları oluşturulmuştur.

Bu çalışma, çip görüntülerinin işlenmesi, uygun bir ESRGAN modelinin seçilmesini takiben tamamlayıcı bir adımla birlikte üç ana aşamayı içermektir. Bu aşamalar, renk uzayı dönüşümlerinin gerçekleştirildiği ön işleme(pre-processing); çip şekli dönüşümlerinin uygulandığı ana işleme(main) ve son dokunuş dönüşümlerinin gerçekleştirildiği son işlemeden(post-processing) oluşur. Ek olarak, çalışma akışına rasterden mozaiğe dönüşüm ve semboloji eşitleme dahil olmak üzere tamamlayıcı dönüşümler uygulanmıştır. Bu makale çip görüntülerini işlemek için kullanılan metodolojiyi ve her aşamanın ve tamamlayıcı adımın arkasındaki mantığı açıklamaktadır.

2.1. Deneysel Prosedürler

Bu çalışmada, İstanbul 2022 Uydu Görüntüsü çip verilerine beş eğitilmiş model uygulanarak, optimum görüntü netliği elde etmek için süper çözünürlük modelleri araştırılmıştır.

Modeller arasında:

  • RealESRGAN_x2plus
  • RealESRGAN_x4plus
  • RealESRGAN_x4plus_anime_6B
  • RealESRGAN_x4plus_netD
  • RealESRNet_x4plus yer almaktadır.

Her modelin ham görüntüler üzerindeki etkisi, görüntü iyileştirmenin bir handikapı olan gerçekçi görüntü akışından uzaklaşmayı en aza indirmede en etkili olanı belirlemek için incelenmiştir. RealESRGAN_x4plus gerçekçi görüntü akışından en az sapan model olarak bulunmuştur ve bu nedenle görüntü iyileştirme işlemi için kullanılmasına karar verilmiştir.

2.1.1. Ön İşleme (Renk Uzayı Dönüşümü)

Harita Genel Müdürlüğü tarafından temin edilen GÖKTÜRK II ve Pleiades uydu görüntüleri .pix formatında sıkıştırılmıştır. Görüntü karoları PIX formatından TIFF formatına dönüştürülmüştür. Ham görüntüler BGR renk uzayında sağlanmış, BGRA renk uzayına sahip görüntü karoları ise RGBA renk uzayına dönüştürülmüştür.

Eğitilen modeller 3D görüntülerden oluşturulduğu için görüntü karolarının saydamlık bilgileri kaldırılmış ve görüntüler dört boyuttan üç boyuta indirilmiştir. Ham görüntülerin derinliği 16 bit olduğundan, elde edilen görüntülerin incelenmesini sağlamak için her bant 16 bitten 8 bite düşürülmüştür.

2.1.2. Çip Ölçeği Dönüşümü

Her bir çip görüntüsü, ArcGIS Pro’daki Export Data For Deep Learning geoprocessing aracı kullanılarak 512×512 çözünürlüklü görüntü çiplerine dönüştürülmüş ve hücre boyutu 50 cm’den 25 cm’ye indirilmiştir. Bu işlem sırasında İstanbul Uydu 2022 görüntüsünden toplam 917.252 karo elde edilmiştir. Çip görüntülerine ait koordinat bilgileri .tfw dosyalarında saklanmıştır. Sonraki aşamada, her bir çip görüntüsü RealESRGAN_x4plus modeli kullanılarak x2 ölçekli Doğal Renk Yerleştirme işlemine tabi tutulmuş ve minimum kayıpla (1024×1024) boyutlarına ölçeklendirilmiştir.

ESRGAN modelinin görüntü üzerindeki etkinliğini artırmak için ham çip görüntüsüne kenar yumuşatma(Anti-Aliasing/AA) tekniği uygulanmıştır. Kenar yumuşatma, bilgisayar grafiklerinde bir ekranda görüntülenen görüntülerde veya metinlerde görünebilecek görsel yapaylıkları azaltmak için kullanılan bir tekniktir. Diyagonal veya kavisli çizgilerin pürüzlü kenarlarını yumuşatarak bunların göze daha pürüzsüz ve doğal görünmesini sağlamaktadır.

2.1.3. Son İşlem (Son Dokunuş Dönüşümü)

RealESRGAN_x4plus modeli ile 1024×1024 çözünürlükte üretilen çip görüntülerindeki gürültü en aza indirilmiştir. Sonraki aşama olarak, gürültü içeriği olmayan görüntüye morfolojik keskinleştirme algoritmaları uygulanmıştır. İyileştirilmiş çip görüntülerine morfolojik son işlem yöntemi olarak OpenCV kütüphanesinden (5, 5) derinliğinde bir keskinleştirme çekirdeği(kernel) uygulanmıştır. ESRGAN uygulamalarında görüntü iyileştirilirken görüntüde pastelleşme meydana gelebilmektedir. Görüntüler gerçeklikten kısmen uzaklaşmaktadır. Bu probleme çözüm olarak, görüntünün keskinleştirilmesi uydu görüntüsünün kenar bölgelerindeki görüntü ifadesini daha belirgin hale getirerek, görüntünün daha net ve gerçekçi aktarımını sağlamıştır. Ölçeklendirilmiş görüntüye morfolojik keskinleştirme algoritmalarının uygulanması detayların daha düzgün bir şekilde öne çıkmasını sağlamaktadır. Keskinleştirilmiş (1024×1024) çip görüntülerini mozaik sürecine düzgün bir şekilde entegre edebilmek için koordinatlarının saklandığı düzlemde her bir çip görüntüsü (512×512)’ye geri ölçeklendirildi. Model girdi veri olarak .tiff formatındaki dosyaları desteklememektedir. Bu nedenle, elde edilen .png dosyaları, piramit görüntüdeki bilgi kaybını önlemek için tekrar tiff formatına dönüştürülmüştür.

ESRGAN modeli ile geliştirilmiş ve morfolojik olarak keskinleştirilmiş çip görüntüleri, mozaikleme işlemi sırasında düzgün birleştirme sağlamak, kaydedilen koordinat verilerine göre verilerin komşuluklarına göre sıralanabilmesi için (512×512) çözünürlüğe geri ölçeklendirilmiştir. Ardından, ArcGIS Pro “Mosaic to New Raster Geoprocessing Tool” kullanılarak kübik yeniden örnekleme yöntemiyle çip görüntüleri mozaiklenmiştir. Mozaik görüntüyü oluşturmak için mozaik operatörü “Son” çip görüntüsüne ve mozaik renk haritası modu “İlk” çip görüntüsü göre ayarlanmıştır. Ham görüntülerden elde edilen semboloji ve streç tipi bilgileri her bir karo görüntüsü için .xml formatında saklanmış ve daha sonra istatistiksel bilgilerle geliştirilmiş mozaik görüntüye uygulanmıştır. Bir semboloji metadolojisi olan Esneme Türü olarak 0,7’lik bir Gama düzeltme değeri saklanırken, her bant için 0,250’lik bir Klip Yüzdesi Eşleme değeri atanmıştır.

A)

Ham İstanbul 2022 Uydu Görüntüsü

C)

Ham İstanbul 2022 Uydu Görüntüsü Zoom Edilmiş Bölge

D)

ESRGAN ile İyileştirilmiş Uydu Görüntüsü Zoom Edilmiş Bölge

B)

ESRGAN İle İyileştirilmiş Uydu Görüntüsü

3. BULGULAR

Bu çalışmada, ham verilere süper çözünürlük uygulanarak elde edilen raster verileri üzerinden, iyileştirilmiş görüntülerin bir nesne algılama modeli olan Segment Anything Modelinin (SEM) performansı üzerindeki etkisini araştırmayı amaçladık. Segment Anything Model (SEM), nesne algılama ve görüntü segmentasyonu yeteneklerini birleştiren Mask R-CNN (Bölge Tabanlı Evrişimsel Sinir Ağı) olarak bilinen son teknoloji bir bilgisayarla görme algoritmasına dayanan bir nesne algılama modelidir. SEM’in performansını, biri süper çözünürlükle işlenmiş ve diğeri herhangi bir ön işleme tabi tutulmamış iki veri seti üzerinden doğruluk ve verimlilik açısından karşılaştırdık. Bu çalışmada ilgilenilen nesne, kentsel planlama ve yönetim için kritik bir görev olduğu için çatı tespiti olarak seçilmiştir. SEM, bir görüntüdeki farklı sınıflardan birden fazla nesneyi tespit etmek ve segmentlere ayırmak için tasarlanmıştır. Karmaşık sahnelerdeki nesneleri, diğer nesneler tarafından kısmen gizlenmiş veya örtülmüş olsalar bile tanımlayabilir. SEM, araçlar, yayalar ve binalar gibi farklı nesne türlerini tespit etmek için çeşitli veri kümeleri üzerinde eğitilebilir. SEM’in geleneksel nesne algılama modellerine göre en büyük avantajı piksel düzeyinde nesne maskeleri üretebilmesidir. Bu özelliği, ilgilenilen nesnelerin yerini belirlemede son derece hassas olmasını ve görüntüdeki her nesnenin sınırlarını tanımlamasını sağlamaktadır. Ayrıca SEM, görüntüdeki bir nesnenin her bir örneğine benzersiz bir etiket atayan daha gelişmiş bir nesne algılama biçimi olan örnek segmentasyonu gerçekleştirmek için de kullanılabilmektedir.

E)

Orjinal Örnek

F)

Ground-Truth Veri

G)

Ham Görüntüye Ait SEM Modeli Çıktısı

H)

ESRGAN İle İyileştirilmiş Görüntüye Ait SEM Modeli Çıktısı

Çalışma, otonom SEM tespit modellerinin çatı vektör poligonlarını tanımlamadaki performansını değerlendirmeyi amaçlamıştır. Örnekteki yer gerçeği verileri 209 poligondan oluşmaktadır ve SEM Ham İstanbul Hava Verileri üzerinde 7 yanlış pozitif tespit ve 5 yanlış negatif ile bunların 197’sini doğru tespit edebilmiştir. Ayrıca SEM, ESRGAN Uygulamalı İstanbul Hava Verileri üzerinde 24 yanlış pozitif tespit ve 2 yanlış negatif tespit ile bunların 207’sini doğru olarak tanımlamıştır.

Bu sonuçlar, SEM’in her iki farklı veri türüne sahip(iyileştirilmiş ve ham) görüntülerdeki çatıların çoğunu doğru bir şekilde tanımlayabildiğini, ancak ESRGAN uygulamalı veriler üzerindeki SEM sonuçlarının daha yüksek bir yanlış pozitif oranına sahip olduğunu ve bunun da tespit edilen çatıların doğruluğunu doğrulamak için ek kaynakların harcanmasına neden olabileceğini göstermektedir. Tersine, ham veriler üzerindeki SEM sonuçları daha düşük bir yanlış pozitif oranına sahiptir, ancak aynı zamanda önemli sayıda çatı tespitini de kaçırmıştır ve bu da daha yüksek yanlış negatiflerle sonuçlanmıştır. Sunulan bulgulara dayanarak, ESRGAN ile geliştirilmiş verilerin ham verilere göre daha iyi sonuçlar verdiği her ne kadar hedef bir amaç olsa da, bu sonucuna varmak zordur. ESRGAN ile geliştirilmiş veri segmentasyon modeli, ham veri segmentasyon modelinden daha yüksek bir Geri Çağırma(Recall) puanı elde ederken, aynı zamanda daha düşük bir Hassasiyet puanına(Precision) ve daha yüksek sayıda yanlış pozitif tahmine sahiptir. Hangi verilerin kullanılacağının seçimi nihayetinde belirli bir uygulamaya ve bu uygulama için kabul edilebilir olan Kesinlik ve Geri Çağırma arasındaki değiş tokuşlara bağlıdır. Yanlış pozitiflerin en aza indirilmesi kritik önem taşıyorsa, ham verinin kullanıldığı segmentasyon modeli tercih edilebilir. Öte yandan, mümkün olduğunca çok sayıda doğru pozitifin belirlenmesi öncelikliyse, ESRGAN ile geliştirilmiş veri üzerinde uygulanacak segmentasyon modeli daha uygun sonuçlar verebilir.

4.TARTIŞMA

Kuruluşlar verilerini daha iyi yönetmek, erişmek ve analiz etmek için dijital teknolojilerden yararlanmak istediklerinden, çeşitli fiziksel kayıt ve materyal türlerinin dijitalleştirilmesi son yıllarda giderek daha önemli hale gelmiştir. Ancak manuel dijitalleştirme, özellikle büyük veri kümeleri için zaman alıcı ve maliyetli bir süreç olabilir. Bu zorluğa yönelik potansiyel bir çözüm, dijitalleştirme sürecini otomatikleştirmek için makine öğrenimi tekniklerini kullanmak, manuel müdahale ihtiyacını azaltmak ve böylece maliyetleri düşürmektir. Makine öğreniminin özellikle etkili olabileceği alanlardan biri de dijital görüntülerin kalitesinin artırılmasıdır. Son yıllarda, ESRGAN gibi derin öğrenme tabanlı görüntü süper çözünürlük yöntemleri, düşük çözünürlüklü görüntülerin kalitesini artırmada büyük umut vaat etmektedir. Özellikle ESRGAN, gerçekçi dokulara ve ayrıntılara sahip yüksek çözünürlüklü görüntüler üretebilen son teknoloji ürünü bir derin öğrenme modelidir. Kuruluşlar, düşük çözünürlüklü görüntüleri iyileştirmek için ESRGAN’ı kullanarak manuel dijitalleştirme için gereken maliyet ve süreyi potansiyel olarak azaltabilir. Örneğin, düşük çözünürlüğe sahip tarihi belgeler veya fotoğraflar söz konusu olduğunda, ESRGAN okunması ve analiz edilmesi daha kolay olan yüksek kaliteli dijital kopyalar oluşturmak için kullanılabilir. Bu, özellikle büyük hacimli verilerin işlenmesi gerektiğinde dijitalleştirme sürecini daha verimli hale getirebilir.

Maliyetleri düşürmenin ve verimliliği artırmanın yanı sıra ESRGAN, SEM modelleri gibi segmentasyon modellerinin performansı üzerinde de önemli bir etkiye sahip olabilir. Segmentasyon modelleri, ilgilenilen nesneleri doğru bir şekilde tanımlamak ve sınıflandırmak için doğru ve ayrıntılı görüntülere dayanır. Düşük çözünürlüklü görüntüleri ESRGAN ile geliştirerek, segmentasyon modelleri daha yüksek kaliteli veriler üzerinde eğitilebilir, bu da doğruluklarını artırabilir ve yanlış pozitifleri azaltabilir.

5.SONUÇ

Bu çalışmada, ESRGAN kullanımı yoluyla uydu görüntülerinin uzamsal çözünürlüğünün artırılmasına odaklanılmıştır. Sonuçlar, sayısallaştırma ve segmentasyon iş akışlarında ESRGAN uygulamasının maliyet azaltma, verimlilik artışı ve gelişmiş doğruluk açısından önemli faydalar sağlayabileceğini göstermiştir. Kuruluşlar, düşük çözünürlüklü görüntüleri iyileştirmek için ESRGAN kullanarak manuel sayısallaştırma sürecini potansiyel olarak kolaylaştırabilir ve maliyetleri azaltabilir. Ayrıca, ESRGAN kullanımı pahalı yüksek çözünürlüklü hava görüntülerine olan ihtiyacı ortadan kaldırabilir ve insan müdahalesine olan bağımlılığı azaltabilir. Bununla birlikte, ESRGAN tarafından üretilen çıktı görüntülerinin kalitesinin çeşitli faktörlere bağlı olarak değişebileceğini ve ESRGAN’ı bir iş akışında uygulamadan önce dikkatli bir değerlendirme ve test yapılması gerektiğini unutmamak önemlidir. Genel olarak ESRGAN, kuruluşların verilerini yönetme ve analiz etme biçimlerini dönüştürme potansiyeli ile makine öğrenimi tabanlı görüntü süper çözünürlük teknikleri için güçlü bir aracı temsil etmektedir.

TEŞEKKÜR

Bu çalışmanın başarıyla tamamlanması, birçok kişi ve kuruluşun desteği ve yardımı olmadan mümkün olamazdı. İstanbul Büyükşehir Belediyesi Coğrafi Bilgi Sistemleri Müdürü Rukiye Aydın Türktaş’a ve İstanbul Büyükşehir Belediyesi Coğrafi Bilgi Sistemleri Müdür Yardımcısı Hande Çovaç’a özveriyle çalışmanın gerçekleşmesi için bu denli değerli verileri sağladıkları ve araştırma süreci boyunca verdikleri sürekli destek için içten teşekkürlerimizi sunarız. Onların çabaları ve katkıları bu çalışmanın başarısının ayrılmaz bir parçası olmuştur. Ayrıca, bu çalışmada yer alan ve geri bildirim ve görüşleriyle araştırmaya katkıda bulunan tüm katılımcılara da teşekkürlerimizi sunarız.

Kaynakça

Çetin, Şükrü B. 2023. Real-ESRGAN: A deep learning approach for general image restoration and its application to aerial images. Advanced Remote Sensing. 3, 2 (Dec. 2023), 90–99.

Şükrü Burak ÇETİN

İstanbul Büyükşehir Belediyesi, Coğrafi Bilgi Sistemi Müdürlüğü

Kavramsallaştırma, Metodoloji, Veri küratörlüğü, Görselleştirme, Yazım-Orijinal Taslak hazırlama, Düzenleme, Yazılım ve Doğrulama

Mustafa Ali GÖKKAYA

İstanbul Büyükşehir Belediyesi, Coğrafi Bilgi Sistemi Müdürlüğü

Yazı İnceleme ve Onay

AKADEMİ’ye Geri Dön