Spatial statistik, yang cukup popular di dalam studi spatial econometric yaitu sebuah cabang ilmu dari urban economic, sebenarnya dibangun dari pelanggaran asumsi dasar regresi linear umum. Di regresi linear kita memperlakukan seluruh variabel bersifat bebas atau independent antara satu dengan yang lain. Tidak adanya tumpang tindih variabel itulah yang dilanggar, kemudian justru dibahas lebih dalam di spatial statistics. Ketidakbebasan variabel ini sebenarnya ditunjukkan oleh ketergantungan spasial dan juga heterogeneitas. Di dalam bahasannya sering disebut sebagai spatial dependency dan spatial heterogeneity. Kita akan bahas satu persatu.

Ada gradasi hubungan dari yang terdekat ke yang jauh. Data yang berdekatan diasumsikan memiliki karakter sama kemudian akan memudar mengikuti jarak yang semakin jauh. Kemiripan karakter di variabel berdekatan ini yang kemudian dapat dijelaskan oleh spatial dependency. Ada kata kunci yang perlu digaris bawahi yaitu: kemiripan dengan variabel yang berdekatan, artinya ada unsur nilai ketetanggaan. Nilai tetangga ini bisa ditentukan berdasarkan 2 cara yaitu (1) jarak antar tetangga, atau (2) identifikasi contiguity. Jarak antar titik amatan biasanya digunakan untuk jenis data titik. Caranya adalah cukup dihitung berdasarkan jarak terdekat (contoh saja: Euclidean distance). Sedangkan contiguity biasanya digunakan untuk amatan berupa data polygon. Yang menarik di sini adalah bagaimana kita menentukan tetangga. Setidaknya ada 3 cara yaitu: (1) dikala sudut polygon berhimpitan, (2) dikala sisi polygon berhimpitan, dan (3) gabungan antara sudut dan sisi. Nilai ketergantungan ini selanjutnya disajikan di dalam matrik bobot untuk mengoreksi variabel dependent, variabel independent dan juga epsilon atau nilai errornya. Itulah kenapa dikala ketergantungan spasial ini nol, maka sebenarnya rumus regresi yang perlu diterapkan adalah cukup regresi linear.

Di sisi lain, ada keragaman spasial yang biasa dipahami sebagai ketidakstabilan struktur (bersifat non-stationer) hubungan antara variabel prediktor dengan variabel respons di dalam suatu ruang/ lokasi tertentu. Ada 2 cara menjelaskannya yaitu berdasarkan (1) ketidakstabilan struktural dan (2) heteroskedastisitas. Untuk yang pertama, ketidakstabilan struktural, berkaitan dengan parameter struktural ditunjukkan oleh koefisien regresi yang tidak stabil pada semua lokasi sehingga hubungan berbeda-beda untuk setiap ruang. Sedangkan untuk yang kedua, heteroskedastisitas, ini berkaitan dengan nilai error (galat) yang tidak sama dari setiap unit spasial. Selain itu, keragaman spasial ini dapat juga dilihat dari struktur spasial atau proses spasial dalam menghasilkan data. Ini juga yang mendasari kenapa koefisien di geographically weighted regression berbeda, itu menunjukkan spatial heterogeneity.

Dari 2 pertimbangan spatial di ataslah spatial statistics dikonstruksi untuk menjelaskan makna sebuah kota dari angka. Galat yang ditunjukkan oleh pelanggaran asumsi dasar regresi juga menjadi penentu model apa yang sebaiknya digunakan.