Doç. Dr. Özgür Baştürk
Ankara Üniversitesi, Astronomi ve Uzay Bilimleri Bölümü
obasturk at ankara.edu.tr
http://ozgur.astrotux.org
Astronomide yıldız, ötegezegen, Güneş sistemi cisimleri, kuyrukluyıldız ve asteroidler, gökadalar, gökada kümeleri gibi cisim katalog ve veritabanlarından, teleskopların gözlemsel verilerini içeren veritabanlarına ve bibliyografi / literatür veritabanlarına kadar pek çok tür veritabanı neredeyse günlük olarak kullanılmaktadır. Bu derste bu veritabanlarına erişim ve sorgulamalara yönelik giriş niteliğindeki bilgi, Python betikleri yardımıyla uygulamalı olarak verilecektir.
astroquery astronomiye yönelik Python uygulamalarının bulunduğu büyük bir modül olan astropy 'la koordina bir şekilde geliştirilen ve çeşitli astronomi veritabanlarına erişim için araçlar sunan bir pakettir ve geniş bir dokümantasyonu da bulunmaktadır.
Örnek olarak aşağıda SIMBAD veritabanında basit bir cisim sorgusu (ing. identifier query) yapabilmeye olanak sağlayan bir Python betiği verilmiştir. astroquery
ile erişebileceğiniz tüm servislerin bir listesini astroquery dokümantasyonunda bulabilirsiniz. Bunların arasında astronomide sık kullanılan kataloglar, veri arşivleri, simülasyonlar ve çizgi listesi servisleri gibi spesifik veri ve bilgi kaynakları bulunmaktadır.
Her servisin kendine özgü nesneleri, metotları, parametreleri ve veri setleri bulunduğundan çok sayıdaki servisin her birine örnek vermek mümkün değildir. Ancak bazı çok kullanılan servisler üzerinden verilecek genel örnekleri takip ederek diğer servislerin temelde nasıl çalıştığı konusunda temel bir fikir edinmek mümkündür. Neredeyse tüm astronomlar tarafından sıkça kullanılan Simbad Veritabanı bunun için iyi bir örnektir.
import astroquery
astroquery.__version__
from astroquery.simbad import Simbad
ELCVn = Simbad.query_object('EL CVn')
ELCVn.pprint()
ELCVn.colnames
Sorgunun sonucu bir astropy tablosudur (astropy tabloları ile ilgili geniş bilgi için bkz.) Bir astropy tablosundaki tüm sütunları görmek için astropy.table
nesnesinin columns
metodu kullanılır.
ELCVn.columns
Herhangi bir sütundaki bilgi sütun adını indeks olarak vermek suretiyle alınabilir. Örneğin cismin koordinatlarının hangi dalgaboyunda yapılan gözlemlerle belirlendiği bilinmek isteniyorsa COO_WAVELENGTH sütunundaki bilgiye aşağıdaki şekillerde erişilebilir. Görüldüğü gibi veritabanlarında herhangi bir bilginin aranan sütunda bulunabilmesi için öncelikle o bilginin veritabanına girilmiş olması gereklidir ve maalesef bunun garantisi de yoktur.
print(ELCVn['COO_WAVELENGTH'])
ELCVn['COO_BIBCODE']
ELCVn['COO_QUAL']
Gördüğünüz bu örnek basit bir nesne sorgusudur. astroquery
modül fonksiyonlarının diğer Python modülleriyle birleştirilerek kullanılmasıyla daha gelişkin sorgular da tasarlanabilir. Aşağıdaki sorguda astropy.coordinates
kütüphanesindeki SkyCoord
fonkskiyonu ICRS koordinat sisteminde bir koordinat oluşturmak üzere kullanılmaktadır. Daha sonra astropy.units
modülündeki arcminute
metoduyla yaydakikası biriminde bir yarıçap tanımı yapılıp, SIMBAD veritabanı bu yarıçap dahilindeki cisimleri verecek şekilde sorgulanmaktadır. Sorgunun sonucunun her satırda en fazla 80 karakteri ve toplamda 10 cismi geçmeyecek şekilde sınırlandırılması ve birimlerinin de gösterilmesi istenmiştir.
from astropy import coordinates
import astropy.units as u
from astroquery.simbad import Simbad
# Sadece ICRS koordinatlarıyla calisir
koordinat = coordinates.SkyCoord("22h22m50s +16d19m20s", frame='fk5')
yaricap = 15.0 * u.arcminute
sorgu = Simbad.query_region(koordinat, radius=yaricap)
sorgu.pprint(show_unit=True, max_width=80)
Sonuçları bir pandas
tablosuna almak ve pandas
fonksiyonlarından yararlanmak da ayrı bir esneklik sağlayacaktır.
pandas_tablosu = sorgu.to_pandas()
pandas_tablosu['MAIN_ID'].value_counts()
astroquery
pek çok veritabanında sorgular yapmayı sağlayan pek çok alt modül barınıdırır. Sorgulanabilecek servislerin listesi üzerinden her birinin dokümantasyonuna ulaşmak mümkündür. Bazı veritabanlarının sunucu ve bağlantıda zaman aşımı gibi seçeneklerin ayarlanmasına olanak sağlayan konfigürasyon dosyası UNIX sistemler için kullanıcı dizininde \$HOME/.astropy/config/astroquery.cfg dosyasında bulunmaktadır. Dosyanın konumu astropy'ın kurulum türüne göre değişiklik gösterebilir. Her bir servisin sağlayıcısı ayrıca github hesapları üzerinden dokümantasyon ve özellikle bu servislere bağlı programlar geliştirmek isteyenler için bilgiler sağlamaktadır.
astroquery
tüm bu veritabanlarına erişim için ortak olan araçlar paketini içeren bir Uygulama Programlama Arayüzü'ne (ing. Application Programming Interface, API) sahiptir. Bir API, modül, yazılım ve sistem bileşenlerinin söz konusu modüü nasıl kullanabileceğini tanımlayan bir arabirimidir. Bo modülle (örneğin astroquery
ile) yapılabilecek arama veya istek türlerini, nasıl yapılacağını, kullanılması gereken veri formatlarını ve izlenecek kuralları tanımlar. astroquery
API'de, çoğu modül için ortak olan standart araçlar; query_object ve query_region 'dır.
Tüm veritabanları için sorgulama yapısı benzer nitelikler içerir.
from astroquery.service import Servis
result = Servis.query_object('Nesne Adı')
Öncelikle astroquery.service
alt modülünden istenen Servis (ya da veritabanı) (IRSA, UKIDSS, SIMBAD, ALMA vs.) $import$ edilir. Daha sonra bu serviste istenen cisimler (tek tek ya da bir liste / döngü / dosya içinden) istenen servisin query_object
metoduyla aranabilir.
Daha önce de örneği verilen bir SIMBAD sorgusu aşağıdaki şekide örneklenebilir.
from astroquery.simbad import Simbad
Simbad.query_object("M 31")
API'nin diğer metodları yarıçap ($radius$) ya da genişliği ($width$) ile tanımlı bir alanda arama yapmak için kullanılan query_region
ve eğer veritabanı görüntü sağlıyorsa get_images
metotlarıdır.
from astropy import coordinates
import astropy.units as u
sorgu = Simbad.query_object("HAT-P-19")
koordinatlar = coordinates.SkyCoord(sorgu['RA'], sorgu['DEC'], \
unit=(u.hourangle, u.deg), frame='icrs')
yaricap = 20*u.arcminute
yeni_sorgu = Simbad.query_region(koordinatlar,radius=yaricap)
yeni_sorgu
Görüntü sağlayan veritabanlarından görüntü de çekilmek istenebilir. Ancak bu noktada bazı veritabanlarının her kullanıcıya açık olmadğını, ancak kullanıcı adı ve şifreyle giriş yapılabildiğini belirtmekte fayda vardır. Örneğin UKIRT Teleskobu'yla süren Kızılöte Derin Gökyüzü Araştırması (UKIRT Infrared Deep Sky Survey) 'den aşağıdaki gibi bir betikle görüntü çekilebilir. Ancak kullanıcı adresi ve şifreye ihtiyaç duyulur.
from astroquery.ukidss import Ukidss
Ukidds.login(username,password)
images = Ukidss.get_images("m1")
Yukarıda HAT-P-19'un koordinatlarını elde etmeye yönelik sorgudan hareketle bu cisim merkezinde bir bölgeinin görüntüsü CDS.Vizier servisinden alınabilir. Ancak bunun için gökyüzü taraması yapan hangi araştırmada (survey) elde edilmiş imajların istendiği de belirtilmelidir. SkyView
tüm gökyüzü araştırmalarının (surveys) listesinden hangi araştırmada, hangi dalgaboyunda ve çözünürlüte elde edilen imajları görüntülemek istiyorsanız ona uygun olanları seçebilirsiniz.
from astropy import wcs
from astroquery.vizier import Vizier
from astroquery.skyview import SkyView
from matplotlib import pyplot as plt
goruntuler = SkyView.get_images(position=koordinatlar, survey='SDSSg')
# Fonksiyon bir imaj listesi dondurur
goruntu = goruntuler[0]
# Bir FITS goruntusu fits.HDUList nesnesi olup; 0. indeksinde goruntu bulunur
# Bu indeksin header nesnesi basligi data nesnesi ise goruntunun kendisini verir
# Bu goruntunun WCS koordinatlari goruntu basliginda bulunur
mywcs = wcs.WCS(goruntu[0].header)
fig = plt.figure(1)
# Bu WCS koordinatlari uzerinden istenen buyuklukte bir goruntu kesilip
# ekrana getirlebilir
ax = fig.add_axes([0.15, 0.1, 0.8, 0.8], projection=mywcs)
ax.set_xlabel("RA")
ax.set_ylabel("Dec")
ax.imshow(goruntu[0].data, cmap='gray_r', interpolation='none', origin='lower',
norm=plt.matplotlib.colors.LogNorm())
Simbad veritabanı Güneş sistemi dışındaki gökcisimleri için temel verileri, farklı kataloglardaki isimlerini, bu cisimler üzerine yapılmış çalışmaların kaynakçasını ve cisim için yapılan çeşitli ölçümleri sağlar. SIMBAD veritabanı sınırlı sorgulama kapasitesine sahiptir. Sunucuya kısa sürelerde büyük sorgular gönderirseniz IP'niz geçici olarak kara listeye alınabilir. Sınırı değişmekle birlikte saniyede 5 ile 10 sorgudan fazla sorgu göndermemek gerekir. Çok sayıda cismi içeren büyük sorgularda nesne isimlerini bir döngü dahilinde dosyalardan okuyarak tek tek sorguya geçirmek yerine bir cisim listesi oluşturup, bu listeyi sorguya göndermekte fayda vardır.
Daha önce basit sorgular için bazı örnekler vermiştik. Şimdi biraz daha ileri sorgularla veritabanından veri almaya çalışalım. Yeni Nesil Transit Araştırması (ing. Next Generation Transit Survey, NGTS), temelde parlak yıldızların etrafında ($V < 13^m$) Neptün'nden daha küçük olan ötegezegenleri geçiş yöntemiyle keşfetmek ve karakterize etmek için tasarlanmış, geniş bir gökyüzü alanında yapılan bir fotometrik araştırmadır. Bu araştırmanın cisimleri NGTS ismi ile kataloglanmaktadır. Şu ana kadar ne kadar NGTS cisminin kataloglandığını öğrenmek için bir Simbad sorgusu aşağıdaki gibi yazılabilir.
from astroquery.simbad import Simbad
sonuc_tablosu = Simbad.query_object("NGTS-*", wildcard=True)
print(sonuc_tablosu)
Görüldüğü gibi tüm NGTS cisimlerini görebilmek için "*" karakterini kullandık. Bu karakterler ("*","?", "[1-9]", "[a-b]" gibi) bir ya da daha çok karakterin yerini tutmak üzere kullanılır (ing. wildcard). Örneğin NGTS'in keşfettiği gezegenleri listelemek için NGTS katalog isminden sonra olası tüm seçenekleri listeleyecek olan (katalogdaki tüm NGTS adıyla kodlanmış cisimler) "*" karakterini kullandıktan sonra gezegen isimlerinin $b$ ile $i$ harfleri arasında isimlerle yıldız isminin sonuna getirileceğini düşünerek (bugüne kadar etrafında en fazla gezegen bulunan sistemde 8 gezegen keşfedilmiştir) aşağıdaki şekilde kurgulanan bir sorgu kullanılabilir.
sonuc_tablosu = Simbad.query_object("NGTS-*[b-i]", wildcard=True)
sonuc_tablosu
Bir ya da daha fazla karakterin yerini tutmak üzere kulanabileceğiniz tüm karakterleri (ing. wildcard) öğrenmek için list_wildcards()
metodu kullanılabilir.
Simbad.list_wildcards()
Bölge sorgularında (query_region
) varsayılan yarıçap $20$ yaydakikasıdır ve astropy.units
kullanılarak değiştirilebilir.
from astroquery.simbad import Simbad
import astropy.units as u
sonuc_tablosu = Simbad.query_region("Polaris", radius=0.1 * u.deg)
# yaricap derece-dakika-saniye ('dms') formatinda da tanimlanabilir
sonuc_tablosu = Simbad.query_region("Polaris", radius='0d6m0s')
print(sonuc_tablosu)
Koordinat sorgularına daha önce örnekler verilmişti. Eğer bu tür sorgularda verilen koordinatların epoch değerleri (bu ölçümlerin referans verildiği zaman) biliniyorsa sorguya parametre olarak geçirilebilir.
from astropy import coordinates as coord
sonuc_tablosu = Simbad.query_region(coord.SkyCoord(ra=02.50, dec=89.90,
unit=(u.hour, u.deg), frame='fk5'),
radius=0.5 * u.deg,
epoch='B1950',
equinox=1950)
print(sonuc_tablosu)
Bölge sorgularında vektörleştirilmiş koordinat aralıklarını kullanmak hem hız açısından daha etkilidir, hem de daha kullanışlıdır.
sonuc_tablosu = Simbad.query_region(coord.SkyCoord(ra=[0, 1], dec=[-1,1],
unit=(u.hour, u.deg), frame='fk5'),
radius=0.1 * u.deg)
sonuc_tablosu
Bir cismin alternatif isimlerini öğrenmek için aşağıdaki gibi bir sorgu kurgulanabilir.
sorgu = Simbad.query_objectids("TYC 7282-1298-1")
sonuc_tablosu = [isim[0] for isim in sorgu]
print(sonuc_tablosu)
Bibliyografik kodu bilinen herhangi bir yayında veri tabanında aranabilir.
from astroquery.simbad import Simbad
sonuc_tablosu = Simbad.query_bibcode('2011A&A...535A..17B')
print(sonuc_tablosu)
Bibliyografik kodu bilinen yayının içinde geçen kataloglanmış ve yayın içinde \astrobj latex anahtarıyla kodlanmış cisimleri almak için de aşağıdaki gibi bir sorgu yazılabilir.
from astroquery.simbad import Simbad
sonuc_tablosu = Simbad.query_bibobj('2011A&A...535A..17B')
print(sonuc_tablosu)
sonuc_tablosu.columns
SIMBAD veritabanının istenen kriter(ler)e göre arama yapılmasını sağlayan bir kriter arayüzü (criteria interface) de bulunmaktadır. astroquery.simbad
bu arayüzün kullanılmasına olanak sağlayan fonksiyonlara da sahiptir. Örneğin Simbad kataloğunda bulunan 12 kadirden daha parlak kataklizmik değişenlerin bir listesine aşağıdaki sorguyla ulaşılabilir. Bu tür sorgular herhangi bir araştırma için hedef listesi oluşturulurken vazgeçilmezdir. Simbad veritabanında yapılabilecek kritere dayalı sorgular için öncelikle ilgili dokümantasyonu dikkatle okumak, sorgularda kullanılabilecek anahtar kelime ve olası karşılaştırma seçeneklerini öğrenmek gereklidir. Ayrıca nesne türü bazında araştırma yapmak için de Simbad'ın nesne sınıflandırma listesini incelemek gerekir.
from astroquery.simbad import Simbad
sonuc_tablosu = Simbad.query_criteria('Vmag < 12 & maintype = "CV*"')
print(sonuc_tablosu)
SIMBAD veritabanı sorgularında ya da sonuçların görüntülenmesinde varsayılan değerler değiştirilebilir. Bir sorgunun sonucundan belirli sayıda satır çekmek için ROW_LIMIT, veritabanının belirli bir sürede sonuç vermediği vakit sorgunun başarısız olarak sonuçlandırılmasını denetleyen TIMEOUT gibi parametreler aşağıdaki şekilde ayarlanıp, istendiğinde değiştirilebilir. Bu ayarlar ayrıca astroquery.cfg konfigürasyon dosyasında da yer almaktadır. Bu dosyadan değiştirilerek kalıcı hale de getirilebilir.
Bunun yanı sıra tüm veriyi bir pandas
veriçerçevesine alıp, pandas paketi görüntüleme opsiyonları (pandas.options
) ile de bu tür ayarlar yapılablir.
Simbad.ROW_LIMIT = 15
Simbad.TIMEOUT = 60
Simbad gibi gelişmiş astronomi veritabanları Sanal Gözlemevi (virtual observatory -- VO) yapılarında tanımlı standartlara uydukları için sütun isimlendirme ve yapıları da bu standartlar dahilindedir. Simbad'da erişilebilir sanal gözlemevi alanları ($VOTABLES$) elde etmek için votable.fields()
fonksiyonu kullanılabilir.
Simbad.list_votable_fields()
Simbad.get_field_description('distance')
Örnek olarak EL CVn yıldızı için oluşturulan tabloya sanal gözlemevi alanları add_votable_fields
fonksiyonuyla eklenebilir. Bu amaçla standart sütunları döndüren bir Simbad sorgusu yerine yeni bir Simbad sorgusu kurgularken bu sütunların da sorguya dahil edilmesi istenir.
customSimbad = Simbad()
customSimbad.add_votable_fields('otype','distance', 'velocity')
ELCVn = customSimbad.query_object("EL CVn")
ELCVn.pprint(show_unit=True)
ELCVn.colnames
print("EL CVn is a {} at a distance of {:.2f} {}".format(ELCVn['OTYPE'][0], ELCVn['Distance_distance'][0],
ELCVn['Distance_unit'][0]))
Bir yıldızın tayf türünü (veritabanında bulunmak şartıyla) elde etmek üzere başka bir örnek aşağıda verilmiştir. Yine öcelikle Simbad() veritabanı nesnesinin bir olgusu (instance) oluşturulur. Daha sonra bu olguya VO tablosu sütunları eklenir (add_votable_fields
). Bu durumda eğer bilgi veritabanında varsa ona da sütun adı (sptype) üzerinden erişilebilir.
customSimbad = Simbad()
customSimbad.add_votable_fields('sptype')
result = customSimbad.query_object('EL CVn')
result
result['SP_TYPE']
Standart sütunlara yenileri eklenebileceği gibi (add_votable_fields()) çıkarılabilir de (remove_votable_fields()). Sanal gözlemevi tabloları eski haline döndürülmek istendiğinde reset_votable_fields fonksiyonu kullanılır.
Simbad.add_votable_fields('typed_id')
Simbad.query_objects(['M51', 'Proxima', 'Antares'])
VizieR, astronomide sık kullanılan kataloglara ve bilimsel yayınların elektronik verilerine birden çok arabirim aracılığıyla erişim sağlayan büyük bir veritabanıdır. Sorgu araçları, kullanıcının ilgili veri tablolarını seçmesine ve verilen kriterlere uyan kayıtları çıkarmasına ve biçimlendirmesine olanak sağlar. 13 Mart 2023 tarihi itibarı ile 23136 katalog içeren VizieR'in tüm bu katalogları sorgulamak için bir de web arayüzü bulunmaktadır.
VizieR, CDS (Centre de Données astronomiques de Strasbourg) ve ESA-ESRIN'in (Bilgi Sistemleri Bölümü) ortak çabası olarak 1996'da kurulmuş bir servistir ve şu anda sadece CDS tarafından yönetilmektedir. Hal-i hazırda VizieR mevcut tüm çevrimiçi katalogları, bazı kataloglarının yapısının uygun olmaması, bazılarının ise VizieR'e hiç duyurulmayan, az kullanılan kataloglar olması nedeniyle içermemektedir. Bu tür katalogların bulunduğu sonunculara Astronomer's Bazaar FTP sunucusu yoluyla erişilebilir.
Belirli bir nesne hakkında bilgi için Vizier'deki çok sayıda katalog aşağıdaki şekilde taranabilir. Sonuç olarak aranan cismin adının geçtiği ve bir satır olarak içinde bulunduğu kataloglar ve bilimsel yayınların veri tabloları listelenir.
from astroquery.vizier import Vizier
# Hızlı radyo patlaması (Fast radio burst -- FRB)
# 121102 için bir arama aşağıdaki gibi kurgulanabilir.
result = Vizier.query_object("FRB121102")
print(result)
Örneğin $\gamma$-ışını gözlemleri yapan Fermi Geniş Alan Teleskobu'nun (Fermi-LAT) kataloğunun kataloğu aşağıdaki şekilde aranabilir.
catalog_list = Vizier.find_catalogs('Gamma', max_catalogs=10000)
print("Toplam {:d} katalog listelenmiştir".format(len(catalog_list)))
catalog_list
Bu kadar geniş bir listede Fermi-LAT kataloğunun hangi yayında yayınlanmış olduğunu belirlemek çok zor olacaktır. Eğer ilgili yayının en azından baş yazarı biliniyorsa ona başvurulabilir.
# Fewer results if we directly search for the author name:
catalog_list = Vizier.find_catalogs('Abdo', max_catalogs=10000)
print({k:v.description for k,v in catalog_list.items()})
Bu listede seçim yapmak daha kolaydır. Örneğin 2nd Fermi-LAT catalog of gamma-ray pulsars ('J/ApJS/208/17') kataloğu seçilebilir.
catalog = Vizier.get_catalogs('J/ApJS/208/17')
catalog.pprint()
Bu yayında yayınlanan 3 tablodan herhangi biri seçilip içeriğine bakılabilir.
catalog[0]
Simbad veritabanındakine benzer şekilde VizieR katalogları için de bölge sorguları yazılabilir. Bu amaçla astropy.SkyCoord
fonksiyonları kullanılarak sorgu daha da esnek ve verimli hale getirilebilir.
Örneğin NOMAD kataloğounda (Zacharias+2004) (Naval Observatory Merged Astrometric Dataset) Crab Bulutsusu etrafında $2^{\circ}$ yarıçaplı bir alanda yer alan, B-bandında $9^{m}$ kadirden daha parlak kaynakları belirlemek için aşağıdaki bir sorgu yazılabilir. Bu amaçla Vizier
modülü başlatılırken B-bandı parlaklığına ($Bmag$) göre bir filtre yapmak üzere column_filters
parametresi kullanılabilir. Listelenen kaynak sayısını sınırlamamak amacıyla query nesnesi için satır limiti ROW_LIMIT=-1
'e ayarlanır.
from astroquery.vizier import Vizier
from astropy.coordinates import SkyCoord
from astropy import units as u
# Select only bright stars
v = Vizier(column_filters={"Bmag":"<9"})
v.ROW_LIMIT = -1
crabNebula = SkyCoord.from_name('Crab Nebula')
result = v.query_region(crabNebula, radius=2.0*u.deg, catalog='NOMAD')
result[0]
Listelenen kaynakların sağaçıklık, dikaçıklık ve B-bandı parlaklıklarını listelemek için aşağıdaki gibi bir kod yazılabilir.
nomad_query = result[0]
nomad_query['RAJ2000', 'DEJ2000','Bmag']
Bu tablo bir astropy.table
yapısındadır.
type(nomad_query)
type(nomad_query)
Bu kaynaklardan hangisinin gözlem sırasında (astropy.time.Time.now()
) problem yaratacağı aşağıdaki gibi bir sorguyla ufuk koordinat sistemine (alt-az) dönüşüm yapılarak denetlenebilir.
from astropy import coordinates as c
from astropy.coordinates import SkyCoord
from astropy import time as t
gozlemevi = c.EarthLocation( lat=28.76194399284443*u.deg, lon=-17.890066533603996*u.deg )
star_coord = SkyCoord(ra=nomad_query['RAJ2000'], dec=nomad_query['DEJ2000'], frame='icrs')
star_coord_altAz = star_coord.transform_to( c.AltAz(obstime=t.Time.now(), location=gozlemevi) )
nomad_query['alt'] = star_coord_altAz.alt
nomad_query['az'] = star_coord_altAz.az
nomad_query.sort('Bmag')
nomad_query['Bmag', 'alt', 'az'].pprint()
Aşağıda SkyView kataloğunu kullanarak istenen bir alanın görüntüsünü çektikten sonra Vizier kataloğunu kullanarak bu görüntü üzerindeki kaynakları belirleyip işaretlemeye yönelik bir örnek verilmiştir. astroquery
her SkyView ve Vizier kataloglarında sorgulama yapaiblmek için birer alt modül sunmaktadır. Katalog sorgularını kullanırken astropy.coordinates
ve astropy.units
modüllerini de kullanmak gerekecektir. Grafikler için yine maptlotlib.pyplot
kullanılabilir.
from astropy import coordinates, units as u, wcs
from astroquery.skyview import SkyView
from astroquery.vizier import Vizier
from matplotlib import pyplot as plt
%matplotlib inline
merkez = coordinates.SkyCoord.from_name('Orion KL')
# Orion Nebula'nin 2MASS-J bandinda bir SkyView goruntusunu alalim
goruntuler = SkyView.get_images(position=merkez, survey='2MASS-H')
# sonucta birden fazla goruntu dondurulurse sadece ilkini kullanalim
goruntu = goruntuler[0]
# dondurulen goruntu bir HDU nesnesidir ve goruntu (imaj)
# bu nesnenin 0. indeksinde yer almaktadir.
koorwcs = wcs.WCS(goruntu[0].header)
fig = plt.figure(1)
# RA / DEC koordinatlarina sahip bir goruntu olusturalim
ax = fig.add_axes([0.15, 0.1, 0.8, 0.8], projection=koorwcs)
ax.set_xlabel("RA")
ax.set_ylabel("Dec")
ax.imshow(goruntu[0].data, cmap='gray_r', interpolation='none', origin='lower',
norm=plt.matplotlib.colors.LogNorm())
# Vizier'den bu bolgedeki nesne bilgilerini cekelim
# Bunun icin J/ApJ/826/16/table1 tablosunu kullanalim
# Herhangi baska bir tabloyu da kullanabilirdik
tablolar = Vizier.query_region(merkez, radius=5*u.arcmin,
catalog='J/ApJ/826/16/table1')
# istedigimiz koordinatlar bu tablolarin birincisindedir
tablo = tablolar[0]
# RA / DEC girdiyi astropy koordinatlarina donusturelim
tablo_koor = coordinates.SkyCoord(tablo['RAJ2000'], tablo['DEJ2000'],
unit=(u.hour, u.deg), frame='fk5')
# cismin cevresindeki diger cisimleri de J/ApJ/540/236 tablosundan alalim
tablolar2 = Vizier(row_limit=10000).query_region(merkez, radius=5*u.arcmin,
catalog='J/ApJ/540/236')
tablo2 = tablolar[0]
tablo2_koor = coordinates.SkyCoord(tablo2['RAJ2000'], tablo2['DEJ2000'],
unit=(u.hour, u.deg), frame='fk5')
# goruntuyu cizdirelim
ax.plot(tablo_koor.ra, tablo_koor.dec, '*', transform=ax.get_transform('fk5'),
mec='b', mfc='none')
ax.plot(tablo2_koor.ra, tablo2_koor.dec, 'o', transform=ax.get_transform('fk5'),
mec='r', mfc='none')
# istedigimiz bolgeye zoom yapabiliriz
ax.axis([100, 200, 100, 200])
plt.show()
SAO/NASA Astrophysics Data System astronomların literatür taramak üzere neredeyse her gün, belki defalarca sorguladıkları eşsiz bir dijital kütüphane portalıdır. ADS, Astronomi ve Astrofizik, Fizik ve arXiv e-baskılarındaki yayınları kapsayan 13 milyondan fazla kayıt içeren üç bibliyografik veri tabanı bulundurmaktadır. Astronomi ve fizik yayınlarının özetleri ve tam metni, yeni ADS modern arama formunun yanı sıra klasik bir arama formu aracılığıyla taranabilir.
astroquery
SAO/NASA ADS veritabanında temel ve ileri düzey sorgular yapabilmek için pek çok fonksiyon sunar. Ancak öncelikle bir ADS hesabınızın olması gerekir. Yeni bir ADS hesabı oluşturmak, ADS hesabınızın ayarlarını kontrol etmek / güncellemek ve bu modülün ilgili fonksiyonlarının çalışabilmesi için gerekli API şifresini almak için öncelikle SAO/NASA ADS login sayfasına giriş yapmanız gerekir. API şifrenizi aldıktan sonra $na.ADS.TOKEN$ değişkenine verebileceğiniz gibi, bir dosyaya alabilir ya da bir çevre değişkeni olarak belirleyebilirsiniz.
from astroquery import nasa_ads as na
# Modul fonksiyonlarini kullanmadan once
# API sifrenizi girmeniz beklenir. Bunun icin oncelikle
# https://ui.adsabs.harvard.edu/user/account/login
# sayfasina giderek (kaydolduktan sonra) API sifrenizi aliniz
# API sifrenizi buradan verebileceğiniz gibi
# bir dosyaya kaydedip adini buraya verebilir
# ya da bir cevre degiskeni olarak ayarlayabilirsiniz.
na.ADS.TOKEN = 'sizin_token_degeriniz'
# varsayilan kayit dondurme sayisi 10'dur ve kayitlar
# tarihe gore yeniden eskiye dogru siralanir
# bu ayarlar degistirilebilir.
# dondurulen kayit sayisini 30'a cikarmak icin
na.ADS.NROWS = 30
# sadece belirli alanlari almak icin
#na.ADS.ADS_FIELDS = ['author','title','abstract','pubdate','bibcode']
# ornegin bir yazarin ilk isim oldugu yayinlari gorebilmek icin
# yazar adinin onune ^ isareti konur
# (bu durum ADS arama sayfasinda da aynidir)
# Bu yapisiyla query_simple yeni ADS arama kutusuyla ayni sekilde calisir
sonuclar = na.ADS.query_simple(query_string="^Basturk exoplanet")
# aramanizi istediginiz bir kritere gore sonradan da siralayabilirsiniz
sonuclar.sort(['pubdate'])
# en son sonucunu basligi
sonsonuc_baslik = sonuclar[-1]['title'][0]
print(sonsonuc_baslik)
# en son sonucun yazar listesi
print(sonuclar[-1]['author'])
na.ADS.ADS_FIELDS
astroquery.nasa_ads
henüz NASA / ADS veritabanı üzerinde çalışan web arayüzünün yeteneklerinin bütününe sahip değildir. Örneğin yayının yayıncıdan ya da arXiv'dan indirilebileceği linkleri sağlamaz, makalenizde doğrudan kullanabileceğiniz bibtex'ini vermez. Ancak dokümantasyounundan da takip edebileceğiniz gibi bu konularda ve modülü geliştirmek üzere çalışılmaktadır. İleride projeleriniz için yazmanız gerekecek kodlarda bu tür aramalara ihtyaç duyabilirsiniz, bu nedenle bu paketin gelişimini takip etmekte fayda vardır.
ads paketi SAO/NASA ADS veritabanı ile etkileşim için önemli bir alternatif sunar. Bu paketi kullanma için de API şifresine ihtiyaç duyulur ve ilgili bölümde anlatıldığı şekilde alınabilir. Eğer python'u Anaconda üzerinden kurduysanız bu paketi kurmamış olmanız ihtimal dahilindedir. Her zamanki gibi $pip$ kurulum paketini kullanarak
$ pip install ads--user
komutu ile kurabileceğiniz gibi projenin github sayfasından kaynak kodu indirip de kurabilirsiniz.
Aşağıda $ads$ paketinin kullanımına bir örnek verilmiştir.
import ads
ads.config.token = 'Ug9VjbHlfR8araNkCVmxRs6vR65EgCLTU0oWAhoq'
sonuclar = ads.SearchQuery(q="HAT-P-19", sort="citation_count")
for sonuc in sonuclar:
print(sonuc.title[0], sonuc.bibcode)
sonuclar.DEFAULT_FIELDS
sonuclar.HIGHLIGHT_FIELDS
Yayın üzerinden arama yapıp başlık ($title$), yazar ($author$), bibliyografi kodu ($bibcode$), özet ($abstract$), makalenizin biyografi bölümünü oluşturmak üzere bibtex girdisi ($bibtex$), atıfları ($citation$), atıf sayısı (citation_count) gibi pek çok bilgiye ulaşabilirsiniz. Sorgunuzun sonucunu atadığınız değişken (yukarıdaki örnekte $sonuclar$ değişkeni) sonuna nokta koyduktan sonra
ADS veritabanında üzerinde sorgu yapabileceğiniz bütün alanlarda $ads$ paketiyle de sorgu yapabilirsiniz. Aşağıda yazar ismiyle yapılmış bir sorgu örneği görüyorsunuz.
sonuclar = list(ads.SearchQuery(author="Basturk, O"))
for sonuc in sonuclar:
print(sonuc.title)
Her sorgu bir $ads.Article$ nesnesi döndürür. Bu nesnenin oldukça kullanışlı pek çok metodu bulunmaktadır. Aşağıda bu metotlara bazı örnekler verilmiştir.
en_son_yayin = sonuclar[0]
# Yayinla ilgili bazı özet bilgiler
print(en_son_yayin)
print(en_son_yayin.author)
print(en_son_yayin.bibcode)
Gaia, galaksimizin kompozisyonunu, oluşumunu ve evrimini ortaya koymak amacıyla Samanyolu'nun üç boyutlu bir haritasını çıkarmak üzere geliştirilmiş bir uzay teleskobu projesidir. Gaia, Galaksimizde ve Yerel Grup genelinde yaklaşık bir milyar yıldızın tayfsal ve kinematik gözlemlerini gerçekleştirmek için bugüne kadar eşi görülmemiş bir duyarlılıkta konum ve radyal hız ölçümleri yapmaktadır.
Gaia arşivi TAP (Table Access Protocol) + REST servisleri üzerine kuruludur. Üzerine kurulu olduğu $TAP+$, Uluslararası Sanal Gözlemevleri Birliği (IVOA) tarafından belirtilen Tablo Erişim Protokolü'nün (TAP: http://www.ivoa.net/documents/TAP/) bir uzantısıdır. TAP sorgu dili, veritabanlarını sorgulamak için yaygın olarak kullanılan Yapılandırılmış Sorgu Dili'ne (ing, Structured Query Language, SQL) benzer bir dil olan Astronomi Veri Sorgu Dili ([Astronomical Data Query Language, ADQL] (http://www.ivoa.net/documents/ADQL/2.0)) 'dir.
TAP, Eşzamanlı (ya da Senkron: Synchronous) ve Asenkron (Asynchronous) olmak üzere iki çalışma modu sunar:
Eşzamanlı: istenen cevap sunucu tarafından alındığında oluşturulur. Bu yöntem büyük boyutlarda sonuç üreten sorgular için kullanılmamalıdır. Eşzamanlı (senkronize) sorgularda sorgunun sonucu döndürülene kadar uygulamadaki başka hiçbir iş (task) gerçekleştirilmez. Uygulamalar, sorgunun veritabanına ilk gönderildiği andan sonuçların alınıp uygulamaya döndürülmesine kadar tüm gidiş-dönüş boyunca bloke edilirler. Bu nedenle, sorgular bir sıra dahilinde gönderilir; biri bitmeden diğeri başlamaz ve beşer dakika çalışacak üç sorgu toplamda 15 dakikada sonuçlanır. Birinin çıktısı diğerine girdi yapılabilir.
Asenkron: sunucu, sorgulama isteğini yürütecek bir iş (task) başlatır. İsteğe ilk yanıt, task durumunu elde etmek için gerekli bilgilerdir. Sorgulama işi bittikten sonra sonuçlar alınabilir. bu durumda sorgular aynı anda gönderilip, aynı anda çalışabilir; yukarıdaki örnekten hareketle beşer dakika sürecek üç sorgunun tamamlanması toplamda yine beş dakika sürer.
Gaia $TAP+$ sunucusu herkese açık, genel (public) ve kullanıcı erişimli (authenticated) olmak üzere iki erişim modu sağlar:
Genel kullanıcı: Bu standart $TAP$ erişimidir. Bir kullanıcı, 'anında' sorguda kullanılacak ADQL sorgularını yürütebilir ve tabloları yükleyebilir (sorgu yürütüldüğünde bu tablolar kaldırılır). Sonuçlar diğer kullanıcılar tarafından kullanılabilir ve sınırlı bir süre için sunucuda kalır.
Kullanıcı erişimli sorgulamalar: bazı işlevler yalnızca kimliği doğrulanmış kullanıcılarla sınırlıdır. Sonuçlar özel bir kullanıcı alanına kaydedilir ve sonsuza kadar sunucuda kalır (kullanıcı tarafından kaldırılabilir).
ADQL sorguları ve sonuçları, kullanıcının özel alanına kaydedilir. Bir kullanıcı özel bir alana tablo yükleyebilir. Bu tablolar sorgularda ve çapraz eşleşme işlemlerinde kullanılabilir.
Örnek olarak basit bir Gaia sorgusu astroquery.gaia
alt modülüyle aşağıdaki şekilde kurgulanabilir. Bu şekilde koordinatları bilinen bir cismin istenen yakınlığında başka bir kaynağın olup olmadığı konusunda bilgi verebilir.
import astropy.units as u
from astropy.coordinates import SkyCoord
from astroquery.gaia import Gaia
koordinatlar = "00h38m04s +34d42m41s"
koor = SkyCoord(koordinatlar, obstime="J2000.", frame='icrs')
ra_aralik = u.Quantity(1, u.arcmin)
dec_aralik = u.Quantity(1, u.arcmin)
sorgu = Gaia.query_object_async(coordinate=koor, width=ra_aralik, height=dec_aralik)
sorgu.pprint()
sorgu['DESIGNATION']
sorgu = Simbad.query_objectids(sorgu['DESIGNATION'])
sonuc_tablosu = [isim[0] for isim in sorgu]
print(sonuc_tablosu)
İstenirse böyle bir sorgu isim üzerinden yapılmak üzere SIMBAD sorgularıyla birleştirilebilir.
NASA Exoplanet Archive veritabanı keşfedilen aday ve onaylanmış ötegezegenler ile onların barınak yıldızları hakkında farklı literatür kaynaklarında yayınlanmış bilgi ve parametrelere erişmek için NASA tarafından geliştirilmiş bir veritabanıdır. Veritabanını astroquery
fonksyonlarıyla sorgulamak için astroquery.ipac.nexsci.nasa_exoplanet_archive
modülü kullanılır. Veritabanının sorgulamalar için bir web arayüzü bulunduğu gibi TAP ve API arayüzleri de bulunmaktadır.
Örneğin WASP-43 b ötegezegenine ilişkin bilgilere erişmek için aşağıdaki gibi bir sorgu yazılabilir. Bu fonksiyonun parametrelerini doğru belirlemek önem taşımaktadır. Zira bir gezegen sisteminin farklı isimlerle de bulunabildiği "aliastable" için API desteği artık bulunmamaktadır. Bu nedenel regularize
parametresinin False
değerine atanması gerekir. Aksi takdirde fonksiyonu ismi verilen gezegen ya da barınak yıldız için aynı gezegenin farklı isimlerle geçtiği satırları da getirmek için aliastable tablosunu taramaktadır ancak bu tabloya API desteği bulunmamaktadır. Ayrıca, table
parametresinin doğru ayarlanması da önemlidir. Bu parametrenin varsayılan değeri olan ps
birden fazla yayından parametrelerin alınabildiği ve her bir gezegen için veritabanında parametre alınan yayın sayısı kadar satırın bulunduğu tablodur. Genellikle keşif yayınından ilgili parametrelerin alınıp, diğer parametrelerin de başka yayınlardan tamamlandığı, dolayısıyla her gezegenin tek bir parametre setiyle ve satırla temsil edildiği tablo (Composite Planet Table) kullanılmak istendiğinde bu parametre pscomppars
değerine ayarlanır.
from astroquery.ipac.nexsci.nasa_exoplanet_archive import NasaExoplanetArchive
exo_sorgu = NasaExoplanetArchive.query_object(object_name="WASP-43",table="ps", regularize=False)
exo_sorgu.colnames
WASP-43 b örneğinde (bir yarıçap değerinin verildiği) ilgili yayınlardaki yarıçap değerleri Jüpiter yarıçapı cinsinden alınmak istenirse aşağıdaki gibi bir sorgu yazılabilir.
import pandas as pd
for satir in exo_sorgu:
if not(pd.isna(satir['pl_radj'])):
print("{:s} gezegeninin {:s} referasindaki yaricapi {:.2f}".
format(satir['pl_name'], satir['pl_refname'], satir['pl_radj']))
Size verilen veritabanlarını astroquery
'nin ilgili alt modül ve fonksiyonlarını kullanarak 10 örnek sorgu üretiniz. Sorgularınızla neleri elde etmeyi amaçladığınızı ve sorgularınızın sonuç olarak ne yaptığını oluşturacağınız Jupyter defterinde açıklamalı olarak anlatınız.
Her bir öğrenci çalışma alanına uygun kendi istediği bir veritabanını seçebilir. Sorguların işinize yarar, kullanılabilir bilgiler döndüren sorgular olmasına özen gösteriniz.