shahar-lab
diff --git a/‎functions/working_model.rdata‎
13 Bytes b/‎functions/working_model.rdata‎
13 Bytes
diff --git a/‎stan_modeling/models/confirmatory_two_alphas/README.html‎
Lines changed: 419 additions & 0 deletions b/‎stan_modeling/models/confirmatory_two_alphas/README.html‎
Lines changed: 419 additions & 0 deletions
diff --git a/‎stan_modeling/models/confirmatory_two_alphas/README.md‎
Lines changed: 9 additions & 0 deletions b/‎stan_modeling/models/confirmatory_two_alphas/README.md‎
Lines changed: 9 additions & 0 deletions
diff --git a/‎stan_modeling/models/confirmatory_two_alphas/confirmatory_two_alphas.R‎
Lines changed: 80 additions & 0 deletions b/‎stan_modeling/models/confirmatory_two_alphas/confirmatory_two_alphas.R‎
Lines changed: 80 additions & 0 deletions
diff --git a/‎stan_modeling/models/confirmatory_two_alphas/confirmatory_two_alphas.exe‎
5.14 MB b/‎stan_modeling/models/confirmatory_two_alphas/confirmatory_two_alphas.exe‎
5.14 MB
diff --git a/‎stan_modeling/models/confirmatory_two_alphas/confirmatory_two_alphas.stan‎
Lines changed: 128 additions & 0 deletions b/‎stan_modeling/models/confirmatory_two_alphas/confirmatory_two_alphas.stan‎
Lines changed: 128 additions & 0 deletions
diff --git a/‎stan_modeling/models/confirmatory_two_alphas/confirmatory_two_alphas_loo.stan‎
Lines changed: 173 additions & 0 deletions b/‎stan_modeling/models/confirmatory_two_alphas/confirmatory_two_alphas_loo.stan‎
Lines changed: 173 additions & 0 deletions
@@ -0,0 +1,9 @@
+## Model two alphas
+This is a model which has two separate alpha parameters depending on whether the prediction error was positive or negative. 
+
+Read ["The computational roots of positivity and
+confirmation biases in reinforcement learning"](https://www.sciencedirect.com/science/article/pii/S1364661322000894) 
+ for more information.
+
+### Parameter recovery
+![Blue dashed lines indicate the true population parameter, black dot the posterior median, and black lines the 89% and 97% CI](parameter_recovery.png)
@@ -0,0 +1,80 @@
+#### simulate Rescorla-Wagner block for participant ----
+sim.block = function(subject,parameters,cfg){ 
+  print(paste('subject',subject))
+  
+#pre-allocation
+  
+  #set parameters
+  alpha_confirmatory = parameters['alpha_confirmatory']
+  alpha_disconfirmatory = parameters['alpha_disconfirmatory']
+  beta  = parameters['beta']
+
+  
+  #set initial var
+  Narms              = cfg$Narms
+  Nraffle            = cfg$Nraffle
+  Nblocks            = cfg$Nblocks
+  Ntrials_perblock   = cfg$Ntrials_perblock
+  expvalues          = cfg$rndwlk
+  rownames(expvalues)=c('ev1','ev2','ev3','ev4')
+  Qval               = as.matrix(t(rep(0.5,Narms)))
+  colnames(Qval)     =sapply(1:Narms, function(n) {paste('Qbandit',n,sep="")})
+  df                 =data.frame()
+  
+for (block in 1:Nblocks){
+  
+  Qval      = as.matrix(t(rep(0.5,Narms)))
+  
+  for (trial in 1:Ntrials_perblock){
+
+    #computer offer
+    raffle    = sample(1:Narms,Nraffle,prob=rep(1/Narms,Narms)) 
+    #raffle    = sort(raffle)
+    
+    #players choice
+    p         = exp(beta*Qval[raffle]) / sum(exp(beta*Qval[raffle]))
+    choice    = sample(raffle,1,prob=p)
+    unchosen  = raffle[choice!=raffle]
+    
+    #outcome 
+    reward = sample(0:1,1,prob=c(1-expvalues[choice,trial],expvalues[choice,trial]))
+    
+    #save trial's data
+    
+      #create data for current trials
+      dfnew=data.frame(
+            subject              = subject,
+            block                = block,
+            trial                = trial,
+            first_trial_in_block = (trial==1)*1,
+            choice               = choice,
+            selected_offer       = (choice==raffle[2])*1,
+            unchosen             = unchosen,
+            offer1               = raffle[1],
+            offer2               = raffle[2],
+            expval_ch            = expvalues[choice,trial],
+            expval_unch          = expvalues[raffle[choice!=raffle],trial],
+            reward               = reward
+            )
+      
+      dfnew=cbind(dfnew,Qval)
+      dfnew=cbind(dfnew,t(t(expvalues)[trial,]))
+      
+      #bind to the overall df
+      df=rbind(df,dfnew)
+       
+    
+    
+    #updating Qvalues
+      if(reward==1){
+    Qval[choice] = Qval[choice] + alpha_confirmatory*(reward - Qval[choice])
+    Qval[unchosen] = Qval[unchosen] + alpha_confirmatory*((1-reward) - Qval[unchosen])
+      }
+      else{
+    Qval[choice] = Qval[choice] + alpha_disconfirmatory*(reward - Qval[choice])
+    Qval[unchosen] = Qval[unchosen] + alpha_disconfirmatory*((1-reward) - Qval[unchosen])
+      }
+  }
+}     
+  return (df)
+}
@@ -0,0 +1,128 @@
+data {
+
+  //General fixed parameters for the experiment/models
+  int<lower = 1> Nsubjects;                                         
+  int<lower = 1> Nblocks;           
+  int<lower = 1> Ntrials;                                           
+  int<lower = 1> Ntrials_per_subject[Nsubjects];                    
+  int<lower = 4> Narms;                                             
+  int<lower = 2> Nraffle; 
+
+
+  //Behavioral data:
+  int<lower = 0> choice[Nsubjects,Ntrials];
+  int<lower = 0> unchosen[Nsubjects,Ntrials];
+  int<lower = 0> reward[Nsubjects,Ntrials];              
+  int<lower = 0> offer1[Nsubjects,Ntrials];              
+  int<lower = 0> offer2[Nsubjects,Ntrials];              
+  int<lower = 0> selected_offer[Nsubjects,Ntrials];      
+  int<lower = 0> first_trial_in_block[Nsubjects,Ntrials];
+
+}
+
+
+transformed data{
+  int<lower = 1> Nparameters=3; 
+  vector[Narms] Qvalue_initial; 
+  Qvalue_initial = rep_vector(0.5, Narms);
+}
+
+
+
+
+parameters {
+  //population level parameters 
+  vector         [Nparameters] population_locations;      
+  vector<lower=0>[Nparameters] population_scales;         
+  
+  //individuals level
+  vector[Nsubjects] alpha_confirmatory_random_effect;
+  vector[Nsubjects] alpha_disconfirmatory_random_effect;
+  vector[Nsubjects] beta_random_effect;
+}
+
+
+transformed parameters {
+  
+  vector<lower=0, upper=1>[Nsubjects] alpha_confirmatory;
+  vector<lower=0, upper=1>[Nsubjects] alpha_disconfirmatory;
+  vector                  [Nsubjects] beta;
+  matrix                  [Ntrials,Nsubjects] p_ch_action;
+  matrix                  [Ntrials,Nsubjects] Qdiff_external;
+  matrix                  [Ntrials,Nsubjects] Qval1_external;
+  matrix                  [Ntrials,Nsubjects] Qval2_external;
+  matrix                  [Ntrials,Nsubjects] Qval3_external;
+  matrix                  [Ntrials,Nsubjects] Qval4_external;
+  matrix                  [Ntrials,Nsubjects] PE_external;
+
+
+
+  //RL
+  for (subject in 1:Nsubjects) {
+    //internal variabels
+    real   Qdiff;
+    real   PE;
+	  real   Qval[Narms]; 
+	  
+    //set indvidual parameters
+    alpha_confirmatory[subject]   = inv_logit(population_locations[1]  + population_scales[1] * alpha_confirmatory_random_effect[subject]);
+    alpha_disconfirmatory[subject]   = inv_logit(population_locations[2]  + population_scales[2] * alpha_disconfirmatory_random_effect[subject]);
+    beta[subject]    =          (population_locations[3]  + population_scales[3] * beta_random_effect [subject]);
+    
+        //likelihood estimation
+        for (trial in 1:Ntrials_per_subject[subject]){
+        
+        //reset Qvalues (first trial only)
+    		if (first_trial_in_block[subject,trial] == 1) {
+        Qval = rep_array(0.5, Narms);
+    		}
+        
+        //calculate probability for each action
+        Qdiff        = Qval[offer2[subject,trial]]- Qval[offer1[subject,trial]];
+
+        p_ch_action[trial,subject] = inv_logit(beta[subject]*Qdiff);
+        
+        //update Qvalues
+        
+        if(reward[subject,trial]==1){
+        Qval[choice[subject,trial]] = Qval[choice[subject,trial]]+alpha_confirmatory[subject]*(reward[subject,trial]  - Qval[choice[subject,trial]]);
+        Qval[unchosen[subject,trial]] = Qval[unchosen[subject,trial]]+alpha_confirmatory[subject]*((1-reward[subject,trial])  - Qval[unchosen[subject,trial]]);
+        }
+        else{
+        Qval[choice[subject,trial]] = Qval[choice[subject,trial]]+alpha_disconfirmatory[subject]*(reward[subject,trial]  - Qval[choice[subject,trial]]);
+        Qval[unchosen[subject,trial]] = Qval[unchosen[subject,trial]]+alpha_disconfirmatory[subject]*((1-reward[subject,trial])  - Qval[unchosen[subject,trial]]);
+        }
+        #appened to external variabels
+        Qdiff_external[trial,subject] = Qdiff;
+        Qval1_external[trial,subject] = Qval[1];
+        Qval2_external[trial,subject] = Qval[2];
+        Qval3_external[trial,subject] = Qval[3];
+        Qval4_external[trial,subject] = Qval[4];
+        PE_external[trial,subject]    = PE;
+        
+        
+      }
+ 
+  }
+
+}
+
+
+model {
+  
+  // population level  
+  population_locations  ~ normal(0,2);            
+  population_scales     ~ cauchy(0,2);        
+
+  // indvidual level  
+  alpha_confirmatory_random_effect ~ std_normal();
+  alpha_disconfirmatory_random_effect ~ std_normal();
+  beta_random_effect  ~ std_normal();
+ 
+
+  for (subject in 1:Nsubjects){
+    for (trial in 1:Ntrials_per_subject[subject]){
+      target+= bernoulli_logit_lpmf(selected_offer[subject,trial] | beta[subject] * Qdiff_external[trial,subject]);
+    }
+  }
+}
@@ -0,0 +1,173 @@
+data {
+  
+  //General fixed parameters for the experiment/models
+  int<lower = 1> Nsubjects;                                         
+  int<lower = 1> Nblocks;           
+  int<lower = 1> Ntrials;                                           
+  int<lower = 1> Ntrials_per_subject[Nsubjects];                    
+  int<lower = 4> Narms;                                             
+  int<lower = 2> Nraffle; 
+  int<lower = 0> fold[Nsubjects,Ntrials];
+  real testfold;
+  
+  //Behavioral data:
+  int<lower = 0> choice[Nsubjects,Ntrials];   
+  int<lower = 0> unchosen[Nsubjects,Ntrials];   
+  int<lower = 0> reward[Nsubjects,Ntrials];              
+  int<lower = 0> offer1[Nsubjects,Ntrials];              
+  int<lower = 0> offer2[Nsubjects,Ntrials];              
+  int<lower = 0> selected_offer[Nsubjects,Ntrials];      
+  int<lower = 0> first_trial_in_block[Nsubjects,Ntrials];
+
+  
+}
+
+
+transformed data{
+  int<lower = 1> Nparameters=3; 
+  vector[Narms] Qvalue_initial; 
+  Qvalue_initial = rep_vector(0.5, Narms);
+}
+
+
+
+
+parameters {
+  //population level parameters 
+  vector         [Nparameters] population_locations;      
+  vector<lower=0>[Nparameters] population_scales;         
+  
+  //individuals level
+  vector[Nsubjects] alpha_confirmatory_random_effect;
+  vector[Nsubjects] alpha_disconfirmatory_random_effect;
+  vector[Nsubjects] beta_random_effect;
+}
+
+
+transformed parameters {
+  
+  vector<lower=0, upper=1>[Nsubjects] alpha_confirmatory;
+  vector<lower=0, upper=1>[Nsubjects] alpha_disconfirmatory;
+  vector                  [Nsubjects] beta;
+  matrix                  [Ntrials,Nsubjects] p_ch_action;
+  matrix                  [Ntrials,Nsubjects] Qdiff_external;
+  matrix                  [Ntrials,Nsubjects] Qval1_external;
+  matrix                  [Ntrials,Nsubjects] Qval2_external;
+  matrix                  [Ntrials,Nsubjects] Qval3_external;
+  matrix                  [Ntrials,Nsubjects] Qval4_external;
+  matrix                  [Ntrials,Nsubjects] PE_external;
+  
+  
+  
+  //RL
+  for (subject in 1:Nsubjects) {
+    //internal variabels
+    real   Qdiff;
+    real   PE;
+    real   Qval[Narms]; 
+    
+    //set indvidual parameters
+    alpha_confirmatory[subject]   = inv_logit(population_locations[1]  + population_scales[1] * alpha_confirmatory_random_effect[subject]);
+    alpha_disconfirmatory[subject]   = inv_logit(population_locations[2]  + population_scales[2] * alpha_disconfirmatory_random_effect[subject]);
+    beta[subject]    =          (population_locations[3]  + population_scales[3] * beta_random_effect [subject]);
+    
+    //likelihood estimation
+    for (trial in 1:Ntrials_per_subject[subject]){
+      if(fold[subject,trial]!=testfold){
+      
+      //reset Qvalues (first trial only)
+      if (first_trial_in_block[subject,trial] == 1) {
+        Qval = rep_array(0.5, Narms);
+      }
+      
+      //calculate probability for each action
+      Qdiff        = Qval[offer2[subject,trial]]- Qval[offer1[subject,trial]];
+      
+      p_ch_action[trial,subject] = inv_logit(beta[subject]*Qdiff);
+      
+      //update Qvalues
+      if(reward[subject,trial]==1){
+        Qval[choice[subject,trial]] = Qval[choice[subject,trial]]+alpha_confirmatory[subject]*(reward[subject,trial]  - Qval[choice[subject,trial]]);
+        Qval[unchosen[subject,trial]] = Qval[unchosen[subject,trial]]+alpha_confirmatory[subject]*((1-reward[subject,trial])  - Qval[unchosen[subject,trial]]);
+        }
+        else{
+        Qval[choice[subject,trial]] = Qval[choice[subject,trial]]+alpha_disconfirmatory[subject]*(reward[subject,trial]  - Qval[choice[subject,trial]]);
+        Qval[unchosen[subject,trial]] = Qval[unchosen[subject,trial]]+alpha_disconfirmatory[subject]*((1-reward[subject,trial])  - Qval[unchosen[subject,trial]]);
+        }
+      //appened to external variabels
+      Qdiff_external[trial,subject] = Qdiff;
+      Qval1_external[trial,subject] = Qval[1];
+      Qval2_external[trial,subject] = Qval[2];
+      Qval3_external[trial,subject] = Qval[3];
+      Qval4_external[trial,subject] = Qval[4];
+      PE_external[trial,subject]    = PE;
+    }  
+      }
+    
+  }
+  
+}
+
+
+model {
+  
+  // population level  
+  population_locations  ~ normal(0,2);            
+  population_scales     ~ cauchy(0,2);        
+  
+  // indvidual level  
+  alpha_confirmatory_random_effect ~ std_normal();
+  alpha_disconfirmatory_random_effect ~ std_normal();
+  beta_random_effect  ~ std_normal();
+  
+  
+  for (subject in 1:Nsubjects){
+    for (trial in 1:Ntrials_per_subject[subject]){
+      if(fold[subject,trial]!=testfold){ //fit parameters only for training set
+      target+= bernoulli_logit_lpmf(selected_offer[subject,trial] | beta[subject] * Qdiff_external[trial,subject]);
+      }
+    }
+  }
+}
+
+generated quantities {
+
+  matrix[Ntrials,Nsubjects]  log_lik;
+  vector[Narms] Qval;
+  vector[Nraffle] Qoffer;
+  real   PE;
+//////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
+//Likelihood function per subject per trial
+log_lik=rep_matrix(0,Ntrials,Nsubjects);
+    for (subject in 1:Nsubjects) {
+ 
+        for (trial in 1:Ntrials_per_subject[subject]){
+         
+         if(fold[subject,trial] == testfold) {
+ 
+      //reset Qvalues (first trial only)
+      if (first_trial_in_block[subject,trial] == 1) {
+        Qval =rep_vector(0.5, Narms);
+      }
+        //offer values
+          Qoffer[1]=Qval[offer1[subject,trial]];
+          Qoffer[2]=Qval[offer2[subject,trial]];
+        log_lik[trial,subject] = bernoulli_logit_lpmf(selected_offer[subject, trial] | beta[subject] * Qoffer);
+
+      
+      
+      //update Qvalues
+      if(reward[subject,trial]==1){
+        Qval[choice[subject,trial]] = Qval[choice[subject,trial]]+alpha_confirmatory[subject]*(reward[subject,trial]  - Qval[choice[subject,trial]]);
+        Qval[unchosen[subject,trial]] = Qval[unchosen[subject,trial]]+alpha_confirmatory[subject]*((1-reward[subject,trial])  - Qval[unchosen[subject,trial]]);
+        }
+        else{
+        Qval[choice[subject,trial]] = Qval[choice[subject,trial]]+alpha_disconfirmatory[subject]*(reward[subject,trial]  - Qval[choice[subject,trial]]);
+        Qval[unchosen[subject,trial]] = Qval[unchosen[subject,trial]]+alpha_disconfirmatory[subject]*((1-reward[subject,trial])  - Qval[unchosen[subject,trial]]);
+        }
+      
+       
+        }
+        }
+    }
+}