Data Science Mülakatları ve Gelebilecek Sorular

İrem Kömürcü
6 min readApr 9, 2022

--

Geçtiğimiz Ocak ayında hızlı bir iş arama sürecine girmiş ve birçok mülakat deneyimi geçirmiştim. Sizlerden de gelen iş arama süreci ve kariyer yolculuğu sorularına bir nebze cevap vermesini dileyerek bu yazıyı yazmak istedim.

Başlamadan önce merak edenler için Büyük Dörtlü (Big Four) olarak geçen şirketlerden Deloitte bünyesinde Data Scientist olarak çalıştığımı ve Şubat ayı itibariyle işe başladığım detayını vermek isterim ❤

Sanırım 10'dan fazla şirketle Data Scientist — Machine Learning Engineer ve Computer Vision Engineer pozisyonları için görüşme gerçekleştirdim. Görüştüğüm şirketler içerisinde büyük global markalar, startuplar ve freelance işler de vardı.

Photo by J. Kelly Brito on Unsplash

Açık olmak gerekirse iş arama sürecine ilk girdiğimde korkuyordum ve acaba yapabilir miyim, yeterli miyim soruları ile kendimi boğuyordum. Bu korkumun en büyük sebebi geçmiş 3 senelik iş tecrübemde iş teklifleri üzerine işe başlamış olmak ve şimdiye kadar nerdeyse hiç iş arama sürecine girmemiş ve mülakat tecrübesi geçirmemiş olmamdı.

Korkularım yersizdi

CV hazırlama ve iş başvurusu yaptığım süreçte yaşadığım bu korkunun ileriyi görememek, kendime güvenmemek, önceden iş başvuru yapmamak gibi sebeplerden kaynaklandığını şuan anlıyorum. Yaptığım mülakatlar bana çok şey kattı ve mülakatlara girdikçe rahatladığımı farkettim. Daha da kaba tabirle mülakatlarda bizi yemiyorlarmış arkadaşlar

Her Süreç Aynı mı?

Girdiğim tüm mülakatlarda süreçlerin birbirinden farklı fakat soruların ve genel isteklerin benzer olduğunu söyleyebilirim.

Kimi şirketler IK aşaması/tanıma şeklinde başlayıp teknik mülakat, case aşaması şeklinde devam ederken, kimi şirketler direkt teknik mülakat ile başlayıp ardından IK mülakatı ile devam ediyor. 6 aşamadan oluşan işe alış süreçleri de var, 1 ya da 2 aşamada biten işe alım süreçleri de var. Her şirket case yollamıyor. Case yollamak yerine live-coding tercih eden şirketler de oluyor.

Kolay Görünen Bir Soru: Biraz Kendinden Bahseder misin?

Girdiğim tüm mülakatlarda gelen ilk soru “biraz kendinden bahseder misin” sorusu oldu. Kulağa çok kolay geliyor değil mi? Aslında tüm mülakat içerisinde mülakatın gidişatını belirleyen bir soru olduğunu söyleyebilirim.

Mülakat soruları temelde sizin önceki tecrübelerinize bağlı olarak gelişiyor. İlgi alanlarınız neler, bu konuda proje çıkarttınız mı, kaç kişilik bir ekiple çalıştınız, hangi programlama dili/frameworku kullandınız, proje şuan canlıda mı gibi sorular mülakatın ilk aşamasını oluşturuyor.

Yani kendinizi ve neler yaptığınızı anlattığınız kısımda vereceğiniz anahtar bilgiler, gelecek diğer soruları da belirleyebiliyor diyebilirim.

Kendinizle alakalı anlattığınız kısımda özgüvenli bir giriş yapmanızı, projelerinizden bahsederken teknik terimler ile açıklama yapmaya gayret göstermenizi, akıcı ve kafa karıştırmayacak şekilde sırayla anlatmanızı öneriyorum.

Anlattığınız konuya hakimiyetinizin, geçmiş projeleri sahiplenişinizin ilk aşamada iyi intiba yaratma konusunda önemli olduğunu gördüm, bunu da belirtmek istiyorum.

Teknik Mülakat Soruları

Gelen teknik soruların ilk kısmında yukarıda belirttiğim “biraz kendinden bahseder misin” sorusunda anlattığınız projelerin teknik kısımlarından sorular geldiğini söyleyebilirim. Anlattığınız projelerinizde gerçekçi olmanız, hakimiyetiniz ve gelecek ilk soruların buradan geleceğini bilmeniz önemli.

Örneğin; sadece structure datalarla uğraşan ve Data Scientist pozisyonu için başvurduğum bir şirkette, önceki projelerim computer vision temelli olduğu için birçok Computer Vision sorusu sorulmuştu. Orada Computer Vision ile uğraşmasam bile temelimi öğrenmek, dediklerimin doğruluğunu test etmek için sorduklarına eminim.

Mülakatların tamamında işin matematiğini anlayıp anlamadığıma yönelik birçok soru gelmişti. Aşağıda listelediğim sorulardan çok daha fazlası, kolay-zor şekillerde farklı senaryolarla soruldu. Bu yüzden aşağıda listelediğim soruları daha detaylı bir şekilde araştırmanız gerektiğini söyleyebilirim. Örnek bazı soruları aşağıda listeliyorum;

  • Relu aktivasyon fonksiyonunu neden çıkış katmanında kullanmıyoruz?
  • Şöyle bir senaryomuz var, bu senaryoya göre çıkış katmanında hangi aktivasyon fonksiyonunu tercih ederdin? Neden?
  • Projelerinde hangi metrikleri kullandın?
  • Precision, Recall, F1 Score gibi metrikleri birbirinden ayırabiliyor musun, farkları neler? XXX senaryosunda hangi metrikleri kullanırdın?
  • Dropout nedir? Hep aynı değere dropout uygulandığında çıktı nasıl etkilenir?
  • Confusion Matriximiz, threshold değerini %50'den %80'e çıkarttığımızda nasıl değişir?
  • ML/DL algoritmalarına hakim misin? (Bu kısımda tüm algoritmaları bilmeniz beklenmiyor fakat özellikle temel algoritmaları bilmeniz artı puan kazandırıyor. Bana PCA, K-Means, SVM, Decision Tree, XGBoost gibi algoritmalarla ilgili sorular gelmişti)
  • Optimizasyon algoritması seçimi ve optimizasyon mantığı
  • pre-trained modellerle daha önce çalıştın mı? Hangilerini kullandın? Çıktına nasıl faydası olmuştu?
  • Transfer learning nedir, daha önce kullandın mı?
  • Augmentation nedir? Amacımızın XXX olduğu bir senaryoda hangi augmentation tekniklerini kullanırdın?
  • Hangi frameworkleri kullandın? Örneğin Tensorflow için tf.record, tf.data özelliklerini biliyor musun ve nasıl kullandın?
  • Normalizasyon nedir, normalizasyon teknikleri nedir? Neden normalizasyon kullanıyoruz?
  • Overfitting-underfitting nedir, hangi durumlarda oluşur? Nasıl müdahale ederdin? (Bu sorular bazen direkt olarak overfitting-underfitting demeden de geliyor. Örneğin train datasında şu kadar başarı varken test datasetinde şu kadar başarı var gibi senaryolarla da sorulabiliyor)
  • Test ve train datasetini nasıl ayırırdın? Validation dataseti neden gerekli?
  • Cross-validation nedir?
  • Regularizasyon nedir, tekniklerin farkları nedir, hangi durumlarda kullanırız?
  • Recommendation sistemleri ve sistem senaryo soruları

Python, R, SQL ve Dahası

Data Scientist pozisyonları için Python oldukça önemli bir programlama dili. Özellikle dataları okuyabiliyor musun, Numpy, Pandas, Scikitlearn gibi kütüphaneleri aktif şekilde kullanabiliyor musun sorusunun cevabını arayan sorular geliyor.

Python programlama dili için kaynakları listelediğim yazıma buradan ulaşabilirsiniz.

Dataları okumak, analiz etmek, şekillendirmek, ön işlemden geçirmek Data Science için çok önemli. Bu yüzden programlama dili ile çeşitli datalarda bunları yapabilmek default bir istek olarak geliyor.

SQL her mülakatta sorulmasa da Data Science pozisyonlarında zaman zaman istenen bir yetenek oluyor. Data science içerisinde işiniz SQL’e düşebiliyor ve bu yüzden mülakatta gelebilecek SQL deneyim sorularına karşı da hazırlıklı olun.

R benim tecrübem olmadığı için sorulmayan ama Data Science mülakatlarında çıkan bir programlama dili.

Programlama dillerini öğrenmek, algoritma yeteneklerinizi geliştirmek için kullanabileceğiniz kaynakları listelediğim yazıma buradan ulaşabilirsiniz.

Photo by Maranda Vandergriff on Unsplash

Cloud Tecrübesi: Google Cloud, AWS ve dahası

Başvurularım sırasında tecrübemin olduğunu belirttiğim, CV’mde de bulunan ve görüşmelerde beni birkaç adım öne geçirdiğini düşündüğüm bir konu Cloud tecrübesi oldu.

Data Science çalışmalarında data yoğunluğu, model karmaşıklığı, kurulum maliyetleri gibi sebeplerle çoğu zaman localde değil Cloud üzerinde çalışma yapılıyor. Bu yüzden notebooklar ile çalışmaya hakim olmak, Anaconda ürünlerini bilmenin yanısıra Cloud teknolojilerinin sunduğu hizmetler konusunda bilgi sahibi olmak önemli. Çoğu zaman bir projeyi baştan yazmaktansa Cloud toollarını kullanmak maliyetleri ciddi oranda düşürüyor. Sadece donanım anlamında değil, toollar konusunda da Cloud ürünleri çok faydalı.

Bu yüzden Data Science mülakatlarına Cloud ürünleri konusunda bilgi, yapabiliyorsanız da deneyim sahibi olarak girmek sizi ciddi derecede öne geçirebilir.

Ters Köşe Sorular

Mülakatta gelen ters köşe sorular da oldu. Teknik tarafta gelen ters köşe soruların haricinde sizin analiz yeteneklerinizi ve düşünme şeklinizi ölçen sorular da geliyor. Bu tarz sorularda sesli düşünmek, yorum yapmaktan çekinmemek, söylediklerinizi bir nedene bağlamak çok önemli.

  • İstanbul’da kaç adet çocuklu aile vardır?
  • Türkiye’de bir yılda kaç litre zeytinyağı kullanılır?
  • Elimizde 8 top ve bir denge tahtası varsa ve toplardan sadece 1'i daha ağırsa ağır topu denge tahtasıyla min kaç hamlede bulabiliriz?
  • Dünyada bir yılda ne kadar şampuan tüketilir?

Sorular sizin için de ters köşe oldu eminim. Bu soruları sorma amaçları Data Science alanının önemli yetkinliklerinden olan farklı durumları değerlendirme, analiz edebilme olduğunu ve buna bağlı olarak her bir sorudaki kaynağı data olarak ele alıp cevaplamanın size artı puan kazandıracağını unutmayın.

Örneğin şampuan kullanma oranı sorusuna; ortalama haftada kaç kez duş alındığı, sizin ne sıklıkta kaç litrelik şampuan kullandığınız güzel bir giriş olabilir. Şampuan kullanmak yerine sabun kullanan insanları, uzun saçlıların tek duşta 2–3 defa saç şampuanlarken, saçı olmayan insanların bir ya da hiç şampuan kullanmayacağı gibi detayları da sesli düşünmek ve veri gözüyle bakalarak anormal, farklı durumları da dile getirmek pozitif etki yaratacaktır.

Sonuç

Data Science alanı oldukça geniş ve şirketler birbirinden farklı sorular sorabiliyor fakat temelde sorulan ML ve Python bilgisi tabanlı sorular neredeyse her mülatın konusunu oluşturuyor.

Mülakata girmekten, teknik aşamaya gelmekten korkmayın. Sorular size ve verdiğiniz cevaplara yönelik ilerliyor çoğu zaman.

LinkedIn ya da farklı iş arama sitelerini kullanarak Data Scientist ilanı açan şirketlerin isteklerin bakabilir, bilmediğiniz teknolojileri not edebilir ve eksiklerinizi gidererek mülakatlara hazırlanabilirsiniz.

Mülakatta pozitif, kendinden emin ve geçmiş projelere güvenir şekilde bulunmak çok önemli. Projeleri uçtan uca anlayabilmek, senaryo oluşturabilmek, analiz edebilmek, sesli düşünebilmek yine mülakatınızın gidişatını olumlu etkileyebilecek önerilerimden :)

Bana sorulmuş olan örnek bazı soruları ve aklımdaki önerileri sıralamak istedim. Umarım harika bir kariyer sizinle olur!

Düzenli olarak kaynak önerileri ve teknik yazılar yazmaya çalışıyorum. Medium hesabımı takip edebilir, yazıyı beğendiyseniz clapsler ile beğeninizi sunabilirsiniz. Yorumlarınız ve benimle kurduğunuz etkileşim beni mutlu edecektir.

Sosyal medya hesaplarıma ulaşmak, benimle iletişime geçmek ve çalışmalarımdan haberdar olmak isterseniz web sitemi bırakıyorum. Twitter başta olmak üzere sosyal medyadan beni takip edebilir, iletişim kurabilirsiniz. Teşekkürler!

--

--

İrem Kömürcü
İrem Kömürcü

Written by İrem Kömürcü

Google Developer Expert on Machine Learning | Data Scientist @Deloitte | iremkomurcu.com

Responses (5)