boltzmann machine tensorflow.py

import tensorflow as tf 
import numpy as np 
import PIL
from tensorflow.examples.tutorials.mnist import input_data 

data = input_data.read_data_sets("tmp/", one_hot=False)
data = np.random.permutation(data.train.images) 

class RBM():
    def __init__(self, nv=28*28, nh=512, cd_steps=3):
        self.graph = tf.Graph() 
        with self.graph.as_default(): 
            
            self.W = tf.Variable(tf.truncated_normal((nv, nh)) * 0.01)
            self.bv = tf.Variable(tf.zeros((nv, 1))) 
            self.bh = tf.Variable(tf.zeros((nh, 1)))
            
            self.cd_steps = cd_steps 
            self.modelW = None 

    def bernoulli(self, p):
            '''Retira amostras Bernoulli segundo um vetor de probabilidades p.'''
            return tf.nn.relu(tf.sign(p - tf.random_uniform(p.shape)))
        
    def energy(self, v):
            '''Energia da MBR, dado um estado visível v.'''
            b_term = tf.matmul(v, self.bv)
            linear_tranform = tf.matmul(v, self.W) + tf.squeeze(self.bh)
            h_term = tf.reduce_sum(tf.log(tf.exp(linear_tranform) + 1), axis=1) 
            return tf.reduce_mean(-h_term -b_term)

    def sample_h(self, v):
            '''Retira uma amostra do estado oculto h, dado o estado visível v'''
            ph_given_v = tf.sigmoid(tf.matmul(v, self.W) + tf.squeeze(self.bh))
            return self.bernoulli(ph_given_v)
        
    def sample_v(self, h):
            '''Retira uma amostra do estado visível v, dado o estado oculto h'''
            pv_given_h = tf.sigmoid(tf.matmul(h, tf.transpose(self.W)) + tf.squeeze(self.bv))
            return self.bernoulli(pv_given_h)

    def gibbs_step(self, i, k, vk):
            '''Realiza uma amostragem de Gibbs alternada'''
            hk = self.sample_h(vk)
            vk = self.sample_v(hk)
            return i+1, k, vk

    def train(self, X, lr=0.01, batch_size=64, epochs=5):
            with self.graph.as_default(): 
                tf_v = tf.placeholder(tf.float32, [batch_size, self.bv.shape[0]])
                v = tf.round(tf_v) 
                vk = tf.identity(v) 

                i = tf.constant(0) 
                _, _, vk = tf.while_loop(cond = lambda i, k, *args: i <= k,
                                        body = self.gibbs_step,
                                        loop_vars = [i, tf.constant(self.cd_steps), vk],
                                        parallel_iterations=1,
                                        back_prop=False)

                vk = tf.stop_gradient(vk) 
                loss = self.energy(v) - self.energy(vk) 
                optimizer = tf.train.AdamOptimizer(lr).minimize(loss)
                init = tf.global_variables_initializer()
            
            with tf.Session(graph=self.graph) as sess:
                init.run()
                for epoch in range(epochs): 
                    losses = []
                    for i in range(0, len(X)-batch_size, batch_size):
                        x_batch = X[i:i+batch_size] 
                        l, _ = sess.run([loss, optimizer], feed_dict={tf_v: x_batch})
                        losses.append(l)
                    
                    print('Custo na época %d: ' % epoch, np.mean(losses), end='\r')
                self.modelW = self.W.eval() 

rbm = RBM(cd_steps=3)
rbm.train(X=data, lr=0.001, epochs=25)

from dl_utils import tile_raster_images

img = tile_raster_images(rbm.modelW.T,
                         img_shape=(28,28),
                         tile_shape=(15,20), tile_spacing=(1, 1))

im = PIL.Image.fromarray(img)
im