Data Mining for the Masses



Yüklə 4,8 Kb.
Pdf görüntüsü
səhifə61/65
tarix08.10.2017
ölçüsü4,8 Kb.
#3815
1   ...   57   58   59   60   61   62   63   64   65

 
Data Mining for the Masses 
232 
 
In all seriousness, when we are dealing with data, those data represent peoples’ lives.  In this book 
alone,  we  have  touched  on  peoples’  buying  behaviors,  ownership  of  creative  works,  and  even 
serious health issues.  Imagine the ethical ramifications of using a decision tree to predict the risk 
levels of juvenile delinquents as just one example.  You’d be profiling, potentially branding these 
youth, so any attempt to do so must be done ethically.  But what does this mean?  Ethics is the set 
of moral codes, above and beyond the legally required minimums, that an individual uses to make 
right  and  respectful  decisions.    When  mining  data,  questions  of  an  ethical  nature  will  invariably 
arise.  Simply because it is legal to gather and mine certain data does not make it ethical. 
 
Because of these serious matters, there are some in the world who fear, shun and even fight against 
data mining.  These types of reactions have led some data mining advocates and leaders to respond 
with attempts to defend  and explain data mining technologies.  One such response came in the 
year 2003.  The Association for Computing Machinery (ACM) is the world’s foremost professional 
organization for computing professionals in all disciplines.  This includes the ACM Special Interest 
Group  for  Knowledge  Discovery  and  Data  Mining  (SIGKDD).    At  that  time,  a  number  of 
criticisms and calls against data mining were occurring, mostly driven by concerns over citizens’ 
privacy as the United States government increased its use of data mining in anti-terrorism activities 
in  the  years  following  the  September  11
th
  terrorist  attacks.    Certainly  any  time  a  government 
increases its scrutiny of its own citizens and those of other countries, it can be unsettling; however 
the leaders of ACM SIGKDD were likewise unsettled by the blame being placed on data mining 
itself.    These  leaders  felt  that  the  tool  should  be  separated  from  the  way  it  was  being  used.    In 
response,  the  executive  committee  of  ACM  SIGKDD,  a  group  that  included  such  pioneers  as 
Gregory  Piatetsky-Shapiro,  Usama  Fayyad,  Jiawei  Han,  and  others,  penned  an  open  letter  titled 
Data Mining” is NOT Against Civil Liberties.  (The two-page text of their letter is easily available on 
the Internet and you are encouraged to read and consider it).  Their objective in writing this letter 
was not to defend government, or any data mining programs, but rather, to help individuals see 
that there is a large difference between a technology and the choices people make in the ways they 
use that technology. 
 
In truth, every technology will have its detractors.  It may seem a silly example, but consider a chair 
as a technology.  It is a tool, invented by mankind to serve a purpose: sitting.  If it is ergonomically 
designed and made of the right materials, it can facilitate very comfortable  sitting.  If it is fancy 
enough, it may exclude certain socio-economic classes from being able to own it.  If pointed into a 


Chapter 14: Data Mining Ethics 
233 
corner and associated with misbehavior, it becomes an object for punishment.  If equipped with 
restraining straps and voltage high enough to take someone’s life, it becomes a politicized object of 
controversy.  If picked up and used to strike another person it becomes a weapon; and yet, it is still 
a chair.  So it is with essentially all technologies—all tools invented by mankind to do work.  It is 
not the tool, but the choices we make in how to use it, that  create and answer the questions of 
ethics. 
 
This is not a simple proposition.  Every one of us have a different moral compass.  Each is guided 
by a different set of values and influenced by a unique set of backgrounds, experiences and forces.  
No one set of ethical guidelines is completely right or completely wrong.  However, there are ways 
for each of us to reflectively evaluate, at least for our own, and hopefully for our organizations’ 
purposes, what our ethical parameters will be for each data mining activity we undertake.  In order 
to aid in this process, we offer here a series of… 
 
ETHICAL FRAMEWORKS AND SUGGESTIONS 
 

 
The brilliant legal scholar Lawrence Lessig has offered four mechanisms whereby we can 
frame and contain computing activities within reasonable bounds.  These are: 

 
Laws:  These are statutes, enacted by a government and enforced by the same.  If 
these are violated, they carry with them a prescribed punishment, adjudicated by a 
judge or a jury.  Adherence to laws as a mechanism for right behavior represents 
the basest form of ethical decision making, because at this level, a person is merely 
doing what they have to do to stay out of trouble.  Lessig suggests that while we 
often look to laws first as a method to enforce good behavior, there are other more 
reasonable and perhaps more effective methods. 

 
Markets:  Here Lessig suggests an economic solution to guiding behavior.  If bad 
behavior is not profitable or would not enable an organization to stay in business, 
then bad behavior will not be prevalent.  There are many ways that market forces, 
such  as  a  good  reputation  for  high  quality  products,  excellent  customer  service, 
reliability, etc., can help guide good actions. 

 
Code:  In computing disciplines, code is a powerful guide of behavior, because it can 
be written to allow some actions while stopping others.  If we feel that although it 
would not be illegal for members of a web site to access one another’s accounts, 


Yüklə 4,8 Kb.

Dostları ilə paylaş:
1   ...   57   58   59   60   61   62   63   64   65




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə